By · Last updated 2026-06-05

返回博客GDPR 与合规

意大利Garante:AI与个人信息合规

意大利Garante于2024年12月对OpenAI处以1500万欧元罚款,并于2023年临时封禁ChatGPT。63%的意大利企业缺乏AI数据治理政策。

June 5, 20269 分钟阅读
Italy Garantecodice fiscale detectionChatGPT ban ItalyItalian data protectionAI GDPR compliance

意大利Garante:GDPR与个人信息技术合规

2026年更新版

意大利最活跃的隐私监管机构

「个人数据保护局」(Garante per la protezione dei dati personali)是意大利的数据监管机构,也是欧盟最活跃的AI监管机构。

两项执法行动定义了其监管方式。2023年3月,Garante责令OpenAI在意大利暂停ChatGPT服务,认定其缺乏合法的数据处理依据,且未对未成年用户进行年龄验证。随后,OpenAI增加了年龄管控措施、训练数据退出选项,并提供意大利语隐私声明。服务于2023年4月恢复。

2024年12月,该机构对OpenAI处以1500万欧元罚款,原因涉及三点:缺乏合法处理依据、未明确告知训练数据用途、未对未成年用户进行年龄验证。

任何处理意大利用户个人数据的AI工具,均须满足上述标准。

OpenAI案例中的合规缺陷

1500万欧元的罚款指向具体漏洞,每一项均对应缺失的技术控制措施。

训练数据的法律依据: Garante拒绝将「合法利益」作为基于用户数据训练AI的依据。以个人数据训练AI需要明确同意或合同依据,单纯主张「合法利益」无法通过审查。

透明度: 用户未被告知其数据如何用于训练,也没有清晰的退出途径。

年龄验证: 未成年人可在无年龄核验的情况下访问ChatGPT。Garante将此视为消费级AI工具的硬性要求。

关键影响: 任何在意大利接收用户输入的AI系统,均须有书面记录的GDPR法律依据,「合法利益」属于高风险路径。

意大利国家标识符

意大利拥有独特的ID格式,通用工具往往难以识别。检测体系必须覆盖以下三种标识符。

税务代码(Codice Fiscale)

税务代码是16位国家身份标识符,编码规则涵盖姓氏音节、名字音节、出生日期、性别及出生城市,最后一位为校验字符。

Garante 2024年技术评估发现,通用NLP工具对税务代码的识别率仅为67%。主要原因:工具仅匹配16位字符模式,跳过校验字符逻辑,导致误报;跳过姓名编码规则的工具也无法验证现有代码的有效性。

有效检测需满足三个条件:

  • 完整的校验字符算法
  • 姓氏与名字字母提取规则
  • 基于真实本地数据的测试

增值税号(Partita IVA)

增值税号是意大利11位企业税号,最后一位为校验字符,常见于发票、合同和商业函件。工具必须执行校验字符算法,而非仅匹配11位数字模式。

医疗保健卡(Tessera Sanitaria)

医保卡(tessera sanitaria)的编码中包含税务代码。健康数据属于GDPR第9条规定的「特殊类别数据」,需要更高级别的保护措施。

Garante对AI工具的要求

Garante的指导意见涵盖三个方面。

AI处理前: 数据进入AI系统前必须检测并去除个人信息。对于在意大利使用的AI工具——包括浏览器扩展和MCP服务器——在发送提示词前须剥离税务代码、增值税号和健康数据。有关如何记录此步骤,请参阅我们的合规指南

AI训练: 必须具备明确的法律依据。Garante偏向以「知情同意」作为基于用户内容训练的依据;若采用「合法利益」,则须提供书面利益平衡测试,证明训练目标不凌驾于用户数据权利之上。

AI输出: 生成涉及真实人物内容的系统须应对虚假信息风险。Garante已将「捏造个人数据」列为需要技术修复的独立风险点。

63%的企业合规差距

Garante 2024年调查发现,63%的意大利企业没有符合GDPR的AI政策,该机构已将此差距列为主动审计重点。

缺乏技术控制支撑的政策难以自证合规。Garante重点审查依赖员工自我约束数据使用的企业。我们的安全概览说明了自动化控制措施如何支撑书面政策。

Garante合规的四项控制措施

1. 提交前的个人信息过滤

在输入到达任何AI模型前,剥离税务代码、增值税号和医保卡数据。这是Garante案例逻辑所要求的核心技术修复。

2. 意大利语命名实体识别(NER)

使用基于意大利语文本训练的命名实体模型,例如spaCy的it_core_news。通用英语训练模型无法识别意大利语姓名模式。有关模型选择,请参阅我们的多语言个人信息检测指南

3. 法律依据文档

为每个正在使用的AI工具记录法律依据;若涉及训练,须附上利益平衡测试,并存储于审计人员可快速查阅的位置。

4. 审计日志

记录过滤执行情况、检测到的实体类型及删除内容,为检查人员提供所需证据,无需冗长的人工审核。

参考来源

准备好保护您的数据了吗?

开始使用 285 种实体类型在 48 种语言中匿名化 PII。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.