By · Last updated 2026-06-05

返回博客GDPR 与合规

匈牙利NAIH:人工智能治理与GDPR合规规则

NAIH要求所有处理个人数据的AI系统事先完成数据保护影响评估(DPIA)。匈牙利文本NER准确率仅为67%,远低于欧盟82%的平均水平。

June 5, 20268 分钟阅读
Hungary NAIHAI GDPR complianceTAJ-szám detectionCentral Europe DPAHungarian data protection

匈牙利NAIH:人工智能治理与GDPR合规规则

匈牙利数据保护机构为NAIH(Nemzeti Adatvédelmi és Információszabadság Hatóság,国家数据保护与信息自由局)。在中欧各国数据保护机构中,NAIH发布了最为详细的人工智能治理指导意见。2024年,NAIH共作出38项执法决定,并颁布规定,要求所有处理个人数据的AI系统在部署前必须完成DPIA。这一要求超越了GDPR的基准门槛。

NAIH的AI执法规则

大多数欧盟数据保护机构发布的AI指导意见较为宏观,而匈牙利的做法更进一步——其2024年指导意见在操作层面具体、可落地。

所有AI系统均须完成DPIA: 任何涉及个人数据的AI系统,在部署前必须完成DPIA,即便该处理操作在GDPR第35条下并不属于「高风险」。这比GDPR自身的基于风险的判断方式更为严格。

NAIH的DPIA须包含以下内容:

  • 对AI模型数据输入与输出的技术说明
  • 证明训练数据已匿名化或具有合法处理依据的证据
  • 对算法歧视风险的评估
  • 自动化决策中的人工审核环节
  • AI处理数据的保留与删除计划

年度复审: 当AI系统经历重新训练或重大变更时,NAIH要求每年更新DPIA。

2024年,匈牙利共处理逾89万条GDPR数据请求——对于一个1000万人口的国家而言,这是相当庞大的数量,反映出数据权利的高度活跃以及合规团队所面临的切实压力。

命名实体识别(NER)的准确率差距

NAIH的2024年审查对匈牙利语文本上的NER模型进行了测试,结果准确率仅为67%,而欧盟平均水平为82%。这15个百分点的差距带来了真实的合规成本。

匈牙利语是一种黏着语,通过大量后缀构词。匈牙利语中的姓名、地址和身份证件号码,与英语或德语数据的外观差异显著。以这些语言训练的工具会漏掉大量匈牙利语个人数据。关于这一差距如何影响跨语言GDPR合规,请参阅我们的多语言PII检测指南

NAIH发现,通用NLP工具在61%的文件中无法识别TAJ-szám(社保号),主要原因在于格式变体多样且缺乏校验和支持。

匈牙利国家身份标识符

处理匈牙利语文件的团队,必须准确识别以下ID类型。关于欧盟全范围覆盖的背景,请参阅我们的欧盟国家税号PII检测指南

TAJ-szám(社会保险识别号): 9位社会保障号码,出现于医疗、福利和养老记录中。验证方式采用社保局规定的加权校验和算法。

Adóazonosító jel(个人税号): 10位个人税务识别号,格式为8位核心号加2位校验位,出现于工资单、纳税申报和劳动合同中。

Személyi igazolvány号(身份证号): 全国身份证号码,格式和校验规则遵循签发机构的规定。

Útlevél szám(护照号): 格式和校验规则同样遵循签发机构的规定。

Ügyfélkapu平台的背景

匈牙利通过统一平台Ügyfélkapu(「客户门户」)提供大多数政府服务,逾400万公民通过该平台办理税务、福利、医疗和许可证事务。私营企业也会接入Ügyfélkapu进行工资核算、福利发放或身份验证,这些企业在受监管的场景下处理上述相同的标识符。

NAIH发现,此类企业通常使用国际化PII工具,而这些工具大多不支持上述标识符,由此导致数据漏检并直接引发合规风险。

与欧盟《人工智能法案》的交叉要求

匈牙利较早将《人工智能法案》规则纳入数据保护机构指导意见,NAIH的立场明确清晰。

高风险AI系统载于《人工智能法案》附件三,涵盖就业、信用评分和基本公共服务领域。此类系统既须完成《人工智能法案》的合规评估,也须通过NAIH的DPIA审查。

处理匈牙利境内人员数据的通用AI模型同样需要完成NAIH DPIA,即便该模型未被《人工智能法案》列为高风险系统。

在匈牙利部署AI的团队,核心合规清单包含三项:在上线前完成NAIH DPIA;验证NER工具对上述实体在匈牙利语文本中的覆盖能力;确认TAJ-szám和adóazonosító jel的检测包含校验和验证。

参考资料

准备好保护您的数据了吗?

开始使用 285 种实体类型在 48 种语言中匿名化 PII。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.