返回博客GDPR 与合规

欧盟成员国的GDPR合规性:您的PII工具缺失哪些国家标识符

德国的Steueridentifikationsnummer,法国的Numéro fiscal,意大利的Codice Fiscale,西班牙的NIF/NIE——以美国为中心的PII工具检测SSN,但错过了大多数欧洲国家标识符。跨国团队需要配置的内容如下。

April 20, 20267 分钟阅读
EU national identifiersSteueridentifikationsnummerCodice FiscaleNIFmultinational GDPRtax ID detection

欧盟成员国的GDPR合规性:您的PII工具缺失哪些国家标识符

税务识别号码是任何司法管辖区中最敏感的个人标识符之一。它们用于税务报告、政府福利、就业验证和金融账户开设。在错误的手中,它们会导致身份盗用、欺诈和未经授权的福利索赔。

GDPR将其归类为常规个人数据(非特殊类别),但其敏感性高,暴露会带来显著的现实风险。每个欧盟成员国都有其自己的国家标识符格式——大多数为美国或英国市场构建的PII工具流利地检测SSN和NINO,但完全错过了欧洲组织每天处理的Steueridentifikationsnummer、Codice Fiscale和BSN。

欧洲税务ID概况

每个欧盟成员国以不同方式实施国家识别:

德国: Steueridentifikationsnummer (Steuer-ID)

  • 11位数字,出生时分配
  • 格式:首位数字非零,10位部分无前导零
  • 示例:12345678901
  • 另外:Steuernummer(根据州不同:10-11位数字,具有州特定格式)

法国: Numéro fiscal de référence (SPI)

  • 13位数字
  • 由税务管理局(DGFiP)发放
  • 税务文件上通常显示为"Identifiant fiscal"

意大利: Codice Fiscale

  • 16个字母数字字符
  • 结构:3个字母(姓氏)+ 3个字母(名字)+ 2位数字(出生年份)+ 1个字母(月份)+ 2位数字(日期)+ 4个字母数字(市代码)
  • 示例:RSSMRA85M01H501Z
  • 高特异性格式,可通过校验和验证

西班牙: NIF (Número de Identificación Fiscal)

  • 对于西班牙国民:DNI号码 + 校验字母(8位数字 + 字母),例如:12345678A
  • 对于外国人:NIE (X/Y/Z + 7位数字 + 字母),例如:X1234567A
  • 对于实体:CIF(字母 + 8位数字),例如:B12345678

荷兰: BSN (Burgerservicenummer)

  • 9位数字,带校验位验证(11-proef算法)
  • 用于所有政府服务,通常出现在就业和福利文件中

波兰: PESEL

  • 11位数字编码出生日期、性别和序列号
  • 格式:YYMMDDXXXXX(出生日期编码在前6位数字中)

比利时: Numéro de registre national (RN)

  • 11位数字编码出生日期、序列和校验位

葡萄牙: NIF (Número de Identificação Fiscal)

  • 9位数字,带校验位
  • 格式与西班牙的NIF不同,尽管缩写相同

瑞典: Personnummer

  • 10或12位数字编码出生日期和序列
  • 格式:YYYYMMDD-XXXX或YYMMDD-XXXX

芬兰: Henkilötunnus (HETU)

  • 11个字符编码日期、分隔符、序列和校验位
  • 格式:DDMMYY-XXXC

标准工具遗漏的内容

为美国/英国市场构建的PII检测工具通常包括:

  • 美国SSN (XXX-XX-XXXX)
  • 英国NINO (XX 99 99 99 X)
  • 美国护照号码
  • 美国驾驶执照模式
  • 主要信用卡号码

欧洲国家标识符——即使是Codice Fiscale、BSN和Steuer-ID等主要标识符——在默认配置中经常缺失。支持Presidio默认识别器集而没有EU特定扩展的工具将完全错过这些。

跨国组织的运营影响

一家德国薪资外包公司为500家客户公司处理文件。他们的匿名化工作流程正确删除:

  • 员工姓名 ✓
  • 电子邮件地址 ✓
  • IBAN号码 ✓
  • 电话号码 ✓
  • 德国Steueridentifikationsnummern ✗ — 不在其标准配置中

DPA审计发现指出,与客户会计部门共享的工资单PDF包含未编辑的Steuer-IDs。该公司面临:

  • 历史文件的补救成本
  • DPA执法行动(根据GDPR第83条的潜在罚款)
  • 对于员工数据被曝光的客户的合同责任

合规差距并不是主动发现的——而是由监管机构发现的。

添加EU国家标识符:优先级列表

对于在多个EU司法管辖区运营的组织,自定义实体配置的优先顺序:

第一层(数据处理量最高):

  1. 德国:Steueridentifikationsnummer(就业密集型文件)
  2. 法国:Numéro fiscal(薪资、税务文件)
  3. 意大利:Codice Fiscale(极为常见,出现在所有官方文件中)
  4. 西班牙:NIF/NIE(薪资、合同、税务文件)
  5. 荷兰:BSN(就业、政府福利)

第二层(重要但较小的市场): 6. 波兰:PESEL(随着波兰劳动力规模的增长而日益重要) 7. 比利时:RN(比利时拥有许多EU机构) 8. 瑞典:Personnummer(高隐私意识,严格执行) 9. 葡萄牙:NIF(技术部门日益增长) 10. 奥地利:Sozialversicherungsnummer(社会保障背景)

第三层(特定用例): 其余17个EU成员国,基于您的组织处理数据的地点。

实施示例:添加Steueridentifikationsnummer

德国税务识别号码(Steuer-ID)遵循特定格式,可以高精度检测:

模式特征:

  • 11位数字
  • 首位数字:1-9(绝不为0)
  • 无三个相同的连续数字
  • 校验位验证(自定义算法)

模式生成的通俗语言描述: "德国税务识别号码:11位数字,其中首位数字在1到9之间,剩余10位数字可以包含零"

生成的模式: 针对Steueridentifikationsnummer的验证正则表达式,适当的上下文匹配(周围的德语税务文件上下文提高了精度)

验证: 针对一组德国工资单和税务证明进行测试。验证检测率和假阳性率,然后进行生产部署。

集成: 添加到您的德语文件处理预设中。如果处理混合语言文件集,结合语言检测以根据语言应用适当的国家标识符模式。

在单一工作流程中处理多个国家标识符

对于处理来自多个EU国家文件的跨国薪资处理者:

选项1:每个国家的单独预设 创建"德国GDPR"预设、"法国GDPR"预设等。根据文件来源应用相关预设。

选项2:合并EU预设 创建一个激活所有EU国家标识符模式的单一预设。对于一般文本的假阳性风险较高(11位数字恰好匹配Steuer-ID模式但不是税务ID),但在操作上更简单。适用于预期整个文件中都有国家标识符的文件类型。

对于薪资文件:选项1(特定国家预设)与适当的路由 对于混合文件集:选项2与阈值调优

结论

GDPR在整个EU范围内适用,但为美国市场构建的PII检测工具往往不适用。Codice Fiscale、BSN和Steueridentifikationsnummer与SSN同样敏感——并且同样可能出现在组织共享、导出和分析的文件中。

自定义实体创建在数小时内填补了任何国家标识符格式的检测差距。合规团队可以添加Steuer-ID模式,针对样本德国工资单进行测试,并在所有处理工作流程中部署,而无需等待工具供应商将其添加到默认配置中。

发现缺失Steuer-ID检测的DPA审计发现本可以在一次下午的主动合规审查中被发现。

来源:

准备好保护您的数据了吗?

开始使用 285 种实体类型在 48 种语言中匿名化 PII。