By · Last updated 2026-06-05

Powrót do blogaGDPR i zgodność

Wykrywanie PII w języku niemieckim dla zgodności z DSGVO

BfDI odnotował 27 829 zgłoszeń naruszeń w 2024 roku — rekord wszech czasów w Niemczech. 65% niemieckich firm używa narzędzi z niewystarczającą obsługą danych PII w języku niemieckim.

June 5, 20269 min czytania
Germany BfDIDACH complianceSteuer-ID detectionGerman language PIIDSGVO technical

Wykrywanie PII w języku niemieckim dla zgodności z DSGVO

Stan na rok 2026

Niemcy zgłosiły w 2024 roku łącznie 27 829 naruszeń ochrony danych do BfDI i 16 krajowych urzędów ochrony danych — nowy rekord. To 31% wszystkich zgłoszeń RODO w UE. Liczby te świadczą nie tylko o aktywnej kulturze zgłaszania naruszeń. Wskazują również na lukę techniczną: 65% niemieckich firm używa narzędzi do wykrywania PII oferujących niewystarczające wsparcie dla języka niemieckiego.

Trójstopniowe egzekwowanie w Niemczech

Egzekwowanie RODO w Niemczech jest złożone. Rozłożone jest na 17 organów.

BfDI (Federalny Komisarz ds. Ochrony Danych): Właściwy dla organów federalnych, telekomunikacji, operatorów pocztowych i organizacji działających na poziomie ponadkrajowym.

16 krajowych urzędów ochrony danych: Każdy kraj związkowy ma własny urząd z niezależnymi uprawnieniami egzekucyjnymi. Najbardziej aktywne organy:

  • Bawaria – BayLDA: Uznawany za jeden z najbardziej wymagających technicznie urzędów ochrony danych w UE. W 2024 roku przeprowadził audyt ponad 250 organizacji.
  • Hamburg: Pionier w egzekwowaniu przepisów wobec operatorów platform z USA.
  • Badenia-Wirtembergia – LfDI BW: Wydał pierwsze w Niemczech wytyczne RODO specyficzne dla AI.

Firmy w Niemczech mogą być jednocześnie kontrolowane na poziomie federalnym i krajowym. To znacznie zwiększa zapotrzebowanie na dokumentację.

Złożoność obszaru DACH: Trzy systemy prawne, jeden język

Niemiecko-językowe organizacje w obszarze DACH działają w ramach trzech różnych systemów prawnych.

Niemcy: RODO UE z BfDI i krajowymi urzędami ochrony danych. Specyficzne identyfikatory: Steueridentifikationsnummer (11 cyfr), numer dowodu osobistego (10 znaków), IBAN w formacie DE.

Austria: RODO UE z egzekwowaniem przez DSB. Austriackie identyfikatory: numer ubezpieczenia społecznego (SVNR, 10 cyfr), elektroniczne zaświadczenie o pobycie (eAT), numer FinanzOnline.

Szwajcaria: revDSG (obowiązuje od września 2023 roku) — nie jest to RODO UE, ale jest ściśle wzorowane na tym akcie. Szwajcarskie identyfikatory: numer AHV (13 cyfr, format 756.XXXX.XXXX.XX), UID (identyfikator przedsiębiorstwa).

Kto działa we wszystkich trzech krajach, potrzebuje narzędzia do obsługi PII obsługującego tekst w języku niemieckim i wszystkie trzy krajowe identyfikatory. Do tego dochodzi liechtensteinskie DSG jako czwarty system prawny.

Szczegółowe omówienie niemieckich identyfikatorów

Steueridentifikationsnummer (Steuer-ID): 11-cyfrowy numer podatkowy przypisywany niemieckim mieszkańcom od urodzenia. Pierwsza cyfra nie może być zerem. Cyfra kontrolna na końcu jest obliczana algorytmem modulo. Pojawia się we wszystkich niemieckich dokumentach podatkowych, zatrudnieniowych i finansowych.

Numer dowodu osobistego (Personalausweisnummer): Format LNNNNNNNC (1 litera + 8 cyfr + 1 znak kontrolny). Znak kontrolny wynika z ważonego algorytmu sumowania. Każdy obywatel Niemiec i każdy obywatel UE zamieszkały w Niemczech posiada numer dowodu osobistego.

Numer ubezpieczenia społecznego (SV-Nummer): Format NNDDMMYYAAAA (2-cyfrowy kod okręgu + data urodzenia + 2 litery nazwiska + cyfra kontrolna). Używany w dokumentach zatrudnieniowych i emerytalnych.

Niemiecki IBAN: Format DE + 2 cyfry kontrolne + 8-cyfrowy kod banku (BLZ) + 10-cyfrowy numer konta. Poza kontrolą IBAN-Mod-97 należy również walidować format BLZ.

Numer ubezpieczenia zdrowotnego (KVNr): 10-cyfrowy numer (1 litera + 9 cyfr). Litera identyfikuje ubezpieczyciela; cyfry zawierają cyfrę kontrolną.

Luka 65% narzędzi

Zgodnie z badaniem BfDI z 2024 roku, 65% niemieckich firm używa narzędzi PII z niewystarczającą obsługą języka niemieckiego. Konkretne słabości:

Wykrywanie Steuer-ID: Wzorce są dopasowywane bez walidacji cyfry kontrolnej. Generuje to wiele fałszywych wyników pozytywnych dla dowolnych 11-cyfrowych sekwencji liczbowych w niemieckich dokumentach.

Wykrywanie dowodu osobistego: Błędy pojawiają się, gdy format występuje bez wyraźnego określenia „Personalausweis”. Kontekstualne rozpoznawanie wymaga niemieckojęzycznego NER do prawidłowego określenia typu dokumentu.

Rozpoznawanie niemieckich nazw: Modele NLP trenowane na tekstach anglojęzycznych słabo rozpoznają niemieckie imiona i nazwiska. Szczególnie dotknięte są: imiona złożone (Hans-Wilhelm, Anna-Katharina) i nazwy z umlautami (Müller, Schröder, Böhm).

Niemieckie formaty adresów: Straße, Platz, Weg i Gasse strukturalnie różnią się od angielskich formatów adresów. Angielskie parsery systematycznie popełniają błędy w przypadku niemieckich adresów.

Standard zgodności dla BfDI, BayLDA i innych niemieckich organów ochrony danych to: NER w języku niemieckim (spaCy de_core_news lub równoważne), wykrywanie Steuer-ID i dowodu osobistego z walidacją sumy kontrolnej, obsługa SVNR dla dokumentów austriackich i obsługa numeru AHV dla dokumentów szwajcarskich.

Więcej informacji o wielojęzycznych problemach wykrywania znajdziesz w przewodniku po wielojęzycznym wykrywaniu PII dla zgodności z RODO. Techniczne priorytety egzekwowania BfDI są udokumentowane w technicznym przewodniku BfDI dla niemieckich firm. Informacje na temat krajowych numerów podatkowych i identyfikatorów ogólnounijnych znajdziesz w przewodniku po wykrywaniu PII dla numerów podatkowych UE.

Źródła

Gotowy, aby chronić swoje dane?

Rozpocznij anonimizację PII z 285+ typami podmiotów w 48 językach.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.