By · Last updated 2026-06-01

ブログに戻るGDPRおよびコンプライアンス

EU 国家税務ID: PII検出GDPR準拠

EU加盟国ごとの国家税務ID(NIFスペイン、TCNイタリア等)の検出と保護。多言語GDPR準拠ガイド。

June 1, 20267 分で読めます
EU national identifiersSteueridentifikationsnummerCodice FiscaleNIFmultinational GDPRtax ID detection

あなたのPIIツールが見逃すEU国民ID

税務識別番号は非常に機密性の高い識別子です。給与明細、税務書類、銀行申請書に記載されています。漏洩すると、詐欺や個人情報の盗用を可能にします。

GDPRはこれらを個人データとして扱います。現実世界のリスクは高いです。EU各国は独自の国民識別子フォーマットを使用しています。ほとんどのPIIツールは米国または英国市場向けに構築されました。SSNとNINOは容易に検出します。しかし、Steueridentifikationsnummer、Codice Fiscale、BSNを見逃すことが多いです。これらはヨーロッパのチームが毎日処理するフォーマットです。

EU税務IDの全体像

EU各国には独自のフォーマットがあります。最も重要なものを示します。

ドイツ — Steueridentifikationsnummer

Steuer-IDは11桁です。出生時に割り当てられます。最初の桁は1〜9(0は不可)です。同一の桁が3つ連続することはありません。例:12345678901。Steuernummerも使用されます:10〜11桁、フォーマットは州により異なります。

フランス — Numéro fiscal de référence

SPIは13桁です。フランスの税務当局であるDGFiPが発行します。税務書類では「Identifiant fiscal」として表示されます。

イタリア — Codice Fiscale

Codice Fiscaleは16桁の英数字です。姓、名、生年、生月、生日、市区町村をエンコードします。例:RSSMRA85M01H501Z。チェックサムで検証可能なフォーマットです。

スペイン — NIF と NIE

スペイン国民はDNI番号とチェックレターを使用します:8桁+文字、例:12345678A。外国人居住者はNIEを使用します:プレフィックスX/Y/Z+7桁+チェックレター、例:X1234567A。法人はCIFを使用します:文字+8桁、例:B12345678。

オランダ — BSN

BSN(Burgerservicenummer)は9桁です。11-proefチェックデジットアルゴリズムを使用します。給与および給付書類に非常によく見られます。

ポーランド — PESEL

PESELは11桁です。最初の6桁が生年月日をエンコードします。残りの桁が性別とシーケンス番号をエンコードします。

ベルギー — Numéro de registre national

RNは11桁です。生年月日、シーケンス、チェックデジットをエンコードします。

ポルトガル — NIF

ポルトガルのNIF(Número de Identificação Fiscal)はチェックデジット付きの9桁です。略語はスペインのNIFと同じですが、フォーマットは異なります。

スウェーデン — Personnummer

Personnummerは10桁または12桁です。生年月日とシーケンス番号をエンコードします。フォーマット:YYYYMMDD-XXXXまたはYYMMDD-XXXX。

フィンランド — Henkilötunnus

HETUは11文字です。日付、区切り文字、シーケンス、チェック文字をエンコードします。フォーマット:DDMMYY-XXXC。

標準ツールが見逃すもの

米国と英国のツールはデフォルトで以下のパターンを含みます:

  • 米国SSN(XXX-XX-XXXX)。
  • 英国NINO(XX 99 99 99 X)。
  • 米国パスポート番号。
  • 米国運転免許証パターン。
  • 主要なクレジットカード番号。

EU国民識別子は含まれないことが多いです。PresidioのデフォルトリコグナイザーセットのみのツールはEUのIDを見逃します。EU固有の拡張機能がなければ、EUのカバレッジはありません。

実際のコンプライアンスのギャップ

ドイツのある給与計算会社は500社のクライアントにサービスを提供しています。ワークフローは名前、メール、IBAN、電話番号を削除します。しかし、ドイツのSteueridentifikationsnummernを見逃します。そのフォーマットは標準設定に含まれていませんでした。

DPA監査により、給与明細PDFに未削除のSteuer-IDが発見されます。会社は過去の書類の修正コストに直面します。GDPR第83条に基づくDPAの執行措置に直面します。クライアントへの契約上の責任に直面します。

このギャップは会社自身では発見されませんでした。規制当局が先に発見しました。

独自のカバレッジ確認については、GDPRコンプライアンスガイドをご覧ください。

EUカバレッジの優先順位

複数のEU諸国で運営している場合は、この順序で識別子パターンを追加してください。

ティア1 — 最大ボリューム:

  1. ドイツ:Steueridentifikationsnummer。
  2. フランス:Numéro fiscal。
  3. イタリア:Codice Fiscale。
  4. スペイン:NIF/NIE。
  5. オランダ:BSN。

ティア2 — 重要だが規模が小さい市場:

  1. ポーランド:PESEL。
  2. ベルギー:RN。
  3. スウェーデン:Personnummer。
  4. ポルトガル:NIF。
  5. オーストリア:Sozialversicherungsnummer。

ティア3 — 特定のユースケース:

残り17のEU加盟国。チームがデータを処理する場所に基づいて追加してください。

Steueridentifikationsnummerの追加

ドイツのSteuer-IDが最初に追加する最適なパターンです。フォーマットが明確で文書化されています。

Steuer-IDは11桁です。最初の桁は1〜9です。同一の桁が3つ連続することはありません。カスタムアルゴリズムがチェックデジットを検証します。

パターン生成のための平易な説明:「ドイツの税務番号:11桁。最初の桁は1〜9。残り10桁にはゼロを含むことができます。」

パターンを生成したら、ドイツの給与明細と税務証明書でテストしてください。検出率と誤検出率を確認してください。検証合格後のみ展開してください。

ドイツ語プリセットにパターンを追加してください。複数言語の文書セットには、言語検出と組み合わせてください。これにより正しいパターンが正しい文書に適用されます。

プリセット1つか複数か

オプション1 — 国別プリセット:

国ごとにプリセットを作成します。文書を起源別にルーティングします。誤検出率が低くなります。より多くのルーティングロジックが必要です。

オプション2 — 統合EUプリセット:

すべてのEU識別子パターンが有効な単一プリセットを作成します。運用が簡単です。汎用テキストでの誤検出リスクが高くなります。文書全体に識別子が想定される場合に適しています。

給与文書の場合:起源別ルーティングありのオプション1を使用してください。混合文書セットの場合:しきい値調整ありのオプション2を使用してください。

プリセット設定が完全なコンプライアンスワークフローに組み込まれる方法については、セキュリティとコンプライアンスの概要をご覧ください。

監査前にギャップを解消する

GDPRはすべてのEU加盟国で同じように適用されます。米国向けに構築されたツールはそうでないことが多いです。Codice Fiscale、BSN、Steuer-IDはSSNと同じリスクを持ちます。共有文書に同じくらいよく現れます。

カスタムエンティティパターンは数時間で検出ギャップを解消します。Steuer-IDパターンを追加してください。サンプルのドイツ語給与明細でテストしてください。すべてのワークフローに展開してください。ツールベンダーを待つ必要はありません。ギャップを発見するためのDPA監査も必要ありません。


anonym.legalでは、プリセット設定インターフェースからカスタムエンティティタイプを追加できます。パターンは展開前にサンプル文書で検証されます。

出典

データを保護する準備はできましたか?

48言語で285以上のエンティティタイプを使用してPIIを匿名化し始めましょう。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.