By · Last updated 2026-06-05

ブログに戻るGDPRおよびコンプライアンス

Datenschutz Deutsch: PII検出 BfDI DSGVO

ドイツ語での詳細なPII検出テクニック。BfDIガイドラインに基づくDSGVO準拠実装。

June 5, 20269 分で読めます
Germany BfDIDACH complianceSteuer-ID detectionGerman language PIIDSGVO technical

GDPRコンプライアンスのためのドイツ語個人情報検出

2026年版

ドイツは2024年に27,829件のデータ侵害をBfDIおよび16の州データ保護機関に報告しました。これは過去最多の記録です。EUにおけるGDPR違反通知全体の31%に相当します。この数字は活発な報告文化を示すだけではありません。技術的な欠陥も浮き彫りにしています。ドイツ企業の65%が、ドイツ語サポートの不十分な個人情報検出ツールを使用しています。

ドイツにおける三層執行体制

ドイツにおけるGDPRの執行は複雑です。17の機関に分散しています。

BfDI(連邦個人情報保護委員): 連邦機関、通信、郵便サービス、および複数の州にまたがる組織を管轄します。

16のLandesdatenschutzbehörden(州データ保護機関): 各州が独立した執行権限を持つ独自の機関を有しています。最も活発な機関:

  • バイエルン州 – BayLDA: EUで技術的に最も厳しいデータ保護機関の一つと見なされています。2024年には250以上の組織を監査しました。
  • ハンブルク: 米国プラットフォーム事業者への執行において先駆的役割を果たしています。
  • バーデン=ヴュルテンベルク州 – LfDI BW: ドイツ初のAI特化GDPR指針を発行しました。

ドイツの企業は連邦レベルと州レベルで同時に監査を受ける可能性があります。これにより文書化の要件が大幅に増加します。

DACH地域の複雑さ:三つの法的枠組みと一つの言語

ドイツ語圏のDACH地域の組織は三つの異なる規制枠組みのもとで活動しています。

ドイツ: EUのGDPRとBfDI・州データ保護機関による執行。固有識別子:Steueridentifikationsnummer(11桁)、Personalausweisnummer(10文字)、DE形式のIBAN。

オーストリア: EUのGDPRとDSBによる執行。オーストリアの識別子:Sozialversicherungsnummer(SVNR、10桁)、eAT(電子居住許可証)、FinanzOnline番号。

スイス: revDSG(2023年9月施行)— EUのGDPRではありませんが、それに強く倣っています。スイスの識別子:AHV番号(13桁、形式756.XXXX.XXXX.XX)、UID(企業識別番号)。

3か国すべてで活動する組織には、ドイツ語テキストと3か国すべての国家識別子を処理できるPIIツールが必要です。また、リヒテンシュタインのDSGも第四の副次的枠組みとして考慮する必要があります。

ドイツの識別子の詳細

Steueridentifikationsnummer(税務識別番号): ドイツの居住者全員に出生時から割り当てられる11桁の恒久的な税務識別番号。最初の桁はゼロ以外でなければなりません。末尾の検査桁はモジュロアルゴリズムで計算されます。ドイツのあらゆる税務・雇用・金融書類に登場します。

Personalausweisnummer(身分証明書番号): 形式LNNNNNNNC(1文字 + 8桁 + 1検査文字)。検査文字は加重合計アルゴリズムで計算されます。ドイツ市民およびドイツ在住のEU市民はすべてPersonalausweis番号を持っています。

Sozialversicherungsnummer(社会保険番号): 形式NNDDMMYYAAAA(2桁の地域コード + 生年月日 + 姓の頭文字2文字 + 検査桁)。雇用・年金書類で使用されます。

ドイツのIBAN: 形式DE + 2桁の検査桁 + 8桁の銀行コード(BLZ) + 10桁の口座番号。IBan mod-97検証に加え、BLZ形式の検証も必要です。

Krankenversicherungsnummer(健康保険番号): 10文字の番号(1文字 + 9桁)。文字は保険者を識別し、数字には検査桁が含まれます。

65%のツール不足

BfDIの2024年調査によると、ドイツ企業の65%がドイツ語サポートの不十分なPIIツールを使用しています。具体的な欠陥として文書化されているもの:

Steuer-IDの検出: 検査桁の検証なしにパターンマッチングが行われます。これによりドイツ語文書の11桁の数字列に対して多くの誤検知が発生します。

Personalausweis の検出: 「Personalausweis」という明示的なラベルなしに形式が出現した場合にエラーが発生します。文書タイプを正しく識別するためにはドイツ語のNERによる文脈検出が必要です。

ドイツ語の人名認識: 英語テキストで訓練されたNLPモデルはドイツ語の名前をうまく認識できません。特に影響を受けるのは複合名(Hans-Wilhelm、Anna-Katharina)とウムラウトを含む名前(Müller、Schröder、Böhm)です。

ドイツ語の住所形式: Straße、Platz、Weg、Gasseは英語の住所形式と構造的に異なります。英語のパーサーはドイツ語の住所に対して系統的なエラーを生成します。

BfDI、BayLDA、その他のドイツのデータ保護機関に対するコンプライアンスの標準は次のとおりです。ドイツ語のNER(spaCy de_core_newsまたは同等のもの)、チェックサム検証を伴うSteuer-IDおよびPersonalausweis検出、オーストリアの文書向けSVNRサポート、スイスの文書向けAHV番号サポート。

多言語検出の課題について詳しくは、GDPRコンプライアンスのための多言語PII検出ガイドをご覧ください。BfDIの技術的執行の優先事項はドイツ企業向けBfDI技術ガイドに記載されています。ドイツおよびEUの国家税務識別子については、EU税務識別子PII検出ガイドをご参照ください。

出典

データを保護する準備はできましたか?

48言語で285以上のエンティティタイプを使用してPIIを匿名化し始めましょう。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.