あなたのPIIツールが見逃すEU国民ID
税務識別番号は非常に機密性の高い識別子です。給与明細、税務書類、銀行申請書に記載されています。漏洩すると、詐欺や個人情報の盗用を可能にします。
GDPRはこれらを個人データとして扱います。現実世界のリスクは高いです。EU各国は独自の国民識別子フォーマットを使用しています。ほとんどのPIIツールは米国または英国市場向けに構築されました。SSNとNINOは容易に検出します。しかし、Steueridentifikationsnummer、Codice Fiscale、BSNを見逃すことが多いです。これらはヨーロッパのチームが毎日処理するフォーマットです。
EU税務IDの全体像
EU各国には独自のフォーマットがあります。最も重要なものを示します。
ドイツ — Steueridentifikationsnummer
Steuer-IDは11桁です。出生時に割り当てられます。最初の桁は1〜9(0は不可)です。同一の桁が3つ連続することはありません。例:12345678901。Steuernummerも使用されます:10〜11桁、フォーマットは州により異なります。
フランス — Numéro fiscal de référence
SPIは13桁です。フランスの税務当局であるDGFiPが発行します。税務書類では「Identifiant fiscal」として表示されます。
イタリア — Codice Fiscale
Codice Fiscaleは16桁の英数字です。姓、名、生年、生月、生日、市区町村をエンコードします。例:RSSMRA85M01H501Z。チェックサムで検証可能なフォーマットです。
スペイン — NIF と NIE
スペイン国民はDNI番号とチェックレターを使用します:8桁+文字、例:12345678A。外国人居住者はNIEを使用します:プレフィックスX/Y/Z+7桁+チェックレター、例:X1234567A。法人はCIFを使用します:文字+8桁、例:B12345678。
オランダ — BSN
BSN(Burgerservicenummer)は9桁です。11-proefチェックデジットアルゴリズムを使用します。給与および給付書類に非常によく見られます。
ポーランド — PESEL
PESELは11桁です。最初の6桁が生年月日をエンコードします。残りの桁が性別とシーケンス番号をエンコードします。
ベルギー — Numéro de registre national
RNは11桁です。生年月日、シーケンス、チェックデジットをエンコードします。
ポルトガル — NIF
ポルトガルのNIF(Número de Identificação Fiscal)はチェックデジット付きの9桁です。略語はスペインのNIFと同じですが、フォーマットは異なります。
スウェーデン — Personnummer
Personnummerは10桁または12桁です。生年月日とシーケンス番号をエンコードします。フォーマット:YYYYMMDD-XXXXまたはYYMMDD-XXXX。
フィンランド — Henkilötunnus
HETUは11文字です。日付、区切り文字、シーケンス、チェック文字をエンコードします。フォーマット:DDMMYY-XXXC。
標準ツールが見逃すもの
米国と英国のツールはデフォルトで以下のパターンを含みます:
- 米国SSN(XXX-XX-XXXX)。
- 英国NINO(XX 99 99 99 X)。
- 米国パスポート番号。
- 米国運転免許証パターン。
- 主要なクレジットカード番号。
EU国民識別子は含まれないことが多いです。PresidioのデフォルトリコグナイザーセットのみのツールはEUのIDを見逃します。EU固有の拡張機能がなければ、EUのカバレッジはありません。
実際のコンプライアンスのギャップ
ドイツのある給与計算会社は500社のクライアントにサービスを提供しています。ワークフローは名前、メール、IBAN、電話番号を削除します。しかし、ドイツのSteueridentifikationsnummernを見逃します。そのフォーマットは標準設定に含まれていませんでした。
DPA監査により、給与明細PDFに未削除のSteuer-IDが発見されます。会社は過去の書類の修正コストに直面します。GDPR第83条に基づくDPAの執行措置に直面します。クライアントへの契約上の責任に直面します。
このギャップは会社自身では発見されませんでした。規制当局が先に発見しました。
独自のカバレッジ確認については、GDPRコンプライアンスガイドをご覧ください。
EUカバレッジの優先順位
複数のEU諸国で運営している場合は、この順序で識別子パターンを追加してください。
ティア1 — 最大ボリューム:
- ドイツ:Steueridentifikationsnummer。
- フランス:Numéro fiscal。
- イタリア:Codice Fiscale。
- スペイン:NIF/NIE。
- オランダ:BSN。
ティア2 — 重要だが規模が小さい市場:
- ポーランド:PESEL。
- ベルギー:RN。
- スウェーデン:Personnummer。
- ポルトガル:NIF。
- オーストリア:Sozialversicherungsnummer。
ティア3 — 特定のユースケース:
残り17のEU加盟国。チームがデータを処理する場所に基づいて追加してください。
Steueridentifikationsnummerの追加
ドイツのSteuer-IDが最初に追加する最適なパターンです。フォーマットが明確で文書化されています。
Steuer-IDは11桁です。最初の桁は1〜9です。同一の桁が3つ連続することはありません。カスタムアルゴリズムがチェックデジットを検証します。
パターン生成のための平易な説明:「ドイツの税務番号:11桁。最初の桁は1〜9。残り10桁にはゼロを含むことができます。」
パターンを生成したら、ドイツの給与明細と税務証明書でテストしてください。検出率と誤検出率を確認してください。検証合格後のみ展開してください。
ドイツ語プリセットにパターンを追加してください。複数言語の文書セットには、言語検出と組み合わせてください。これにより正しいパターンが正しい文書に適用されます。
プリセット1つか複数か
オプション1 — 国別プリセット:
国ごとにプリセットを作成します。文書を起源別にルーティングします。誤検出率が低くなります。より多くのルーティングロジックが必要です。
オプション2 — 統合EUプリセット:
すべてのEU識別子パターンが有効な単一プリセットを作成します。運用が簡単です。汎用テキストでの誤検出リスクが高くなります。文書全体に識別子が想定される場合に適しています。
給与文書の場合:起源別ルーティングありのオプション1を使用してください。混合文書セットの場合:しきい値調整ありのオプション2を使用してください。
プリセット設定が完全なコンプライアンスワークフローに組み込まれる方法については、セキュリティとコンプライアンスの概要をご覧ください。
監査前にギャップを解消する
GDPRはすべてのEU加盟国で同じように適用されます。米国向けに構築されたツールはそうでないことが多いです。Codice Fiscale、BSN、Steuer-IDはSSNと同じリスクを持ちます。共有文書に同じくらいよく現れます。
カスタムエンティティパターンは数時間で検出ギャップを解消します。Steuer-IDパターンを追加してください。サンプルのドイツ語給与明細でテストしてください。すべてのワークフローに展開してください。ツールベンダーを待つ必要はありません。ギャップを発見するためのDPA監査も必要ありません。
anonym.legalでは、プリセット設定インターフェースからカスタムエンティティタイプを追加できます。パターンは展開前にサンプル文書で検証されます。
出典
- ドイツ連邦中央税務局:Steueridentifikationsnummer. VERIFIED-EXTERNAL.
- GDPR第4条、第9条、第32条 — gdpr-info.eu. VERIFIED-EXTERNAL.
- EDPB:監督当局の権限に関するガイドライン. VERIFIED-EXTERNAL.