By · Last updated 2026-06-05

Tillbaka till BloggenGDPR & Efterlevnad

Tysk PII-detektering för DSGVO-compliance

BfDI rapporterade 27 829 intrångsanmälningar 2024 — Tysklands all-time-rekord. 65 % av tyska företag använder verktyg med otillräckligt stöd för tysk PII.

June 5, 20269 min läsning
Germany BfDIDACH complianceSteuer-ID detectionGerman language PIIDSGVO technical

Tyskspråkig PII-detektering för DSGVO-compliance

Uppdaterat 2026

Tyskland anmälde totalt 27 829 dataskyddsincidenter till BfDI och de 16 Landesdatenschutzbehörderna 2024 — ett nytt rekord. Det motsvarar 31 % av alla GDPR-anmälningar i EU. Dessa siffror visar inte bara en aktiv anmälningskultur. De visar också en teknisk lucka: 65 % av tyska företag använder PII-detekteringsverktyg med otillräckligt stöd för det tyska språket.

Trestegs tillsyn i Tyskland

GDPR-tillsynen i Tyskland är komplex och fördelad på 17 myndigheter.

BfDI (Bundesbeauftragter): Ansvarar för federala myndigheter, telekommunikation, posttjänster och organisationer som verkar över delstatsgränser.

16 Landesdatenschutzbehörden: Varje delstat har en egen myndighet med självständiga tillsynsbefogenheter. De mest aktiva:

  • Bayern – BayLDA: Anses vara en av EU:s tekniskt mest krävande dataskyddsmyndigheter. Granskade över 250 organisationer 2024.
  • Hamburg: Pionjär inom tillsyn mot amerikanska plattformsoperatörer.
  • Baden-Württemberg – LfDI BW: Utfärdade den första AI-specifika GDPR-vägledningen i Tyskland.

Företag i Tyskland kan kontrolleras samtidigt på federal nivå och delstatsnivå, vilket avsevärt ökar dokumentationsbehoven.

DACH-komplexitet: Tre rättsliga ramverk, ett språk

Tyskspråkiga organisationer i DACH-regionen verkar under tre olika rättsliga ramverk.

Tyskland: EU-DSGVO med BfDI och Landesdatenschutzbehörden. Specifika identifierare: Steueridentifikationsnummer (11 siffror), Personalausweisnummer (10 tecken), IBAN i DE-format.

Österrike: EU-DSGVO med DSB-tillsyn. Österrikiska identifierare: Sozialversicherungsnummer (SVNR, 10 siffror), eAT (elektronischer Aufenthaltstitel), FinanzOnline-nummer.

Schweiz: revDSG (i kraft sedan september 2023) — inte EU-DSGVO, men tätt kopplat till det. Schweiziska identifierare: AHV-nummer (13 siffror, format 756.XXXX.XXXX.XX), UID (Unternehmensidentifikation).

Den som verkar i alla tre länder behöver ett PII-verktyg som hanterar tyskspråkig text och alla tre nationella identifierare. Därtill kommer Liechtensteins DSG som ett fjärde ramverk.

Tyska identifierare i detalj

Steueridentifikationsnummer (Steuer-ID): Ett 11-siffrigt skatte-ID som tilldelas tyska invånare från födseln. Första siffran får inte vara noll. En kontrollsiffra i slutet beräknas med en modulo-algoritm. Förekommer i alla tyska skatte-, anställnings- och finansdokument.

Personalausweisnummer: Format LNNNNNNNC (1 bokstav + 8 siffror + 1 kontrollsiffra). Kontrollsiffran beräknas med en viktad summaalgoritm. Varje tysk medborgare och varje EU-medborgare bosatt i Tyskland har en Personalausweisnummer.

Sozialversicherungsnummer (SV-Nummer): Format NNDDMMYYAAAA (2-siffrig regionkod + födelsedatum + 2 bokstäver från efternamnet + kontrollsiffra). Används i anställnings- och pensionsdokument.

Tysk IBAN: Format DE + 2 kontrollsiffror + 8-siffrig bankleitzahl (BLZ) + 10-siffrig kontonummer. Utöver IBAN Mod-97-kontrollen måste även BLZ-formatet valideras.

Krankenversicherungsnummer (KVNr): 10-siffrig nummer (1 bokstav + 9 siffror). Bokstaven identifierar försäkringsgivaren; siffrorna innehåller en kontrollsiffra.

De 65 %-verktygsluckan

Enligt BfDI:s undersökning 2024 använder 65 % av tyska företag PII-verktyg med bristfälligt stöd för tyska. Konkreta svagheter:

Steuer-ID-detektering: Mönster matchas utan kontrollsiffervalidering, vilket ger många falskt positiva träffar på godtyckliga 11-siffriga talsekvenser i tyska dokument.

Personalausweis-detektering: Fel uppstår när formatet förekommer utan den explicita beteckningen "Personalausweis". Kontextuell igenkänning kräver tyskspråkig NER för att korrekt fastställa dokumenttypen.

Tysk namnigenkänning: NLP-modeller tränade på engelskspråkig text identifierar tyska namn dåligt. Särskilt drabbade är sammansatta namn (Hans-Wilhelm, Anna-Katharina) och namn med umlaut (Müller, Schröder, Böhm).

Tyska adressformat: Straße, Platz, Weg och Gasse skiljer sig strukturellt från engelska adressformat. Engelska parsers ger systematiska fel vid tyska adresser.

Compliancestandarden för BfDI, BayLDA och andra tyska dataskyddsmyndigheter är: tyskspråkig NER (spaCy de_core_news eller likvärdigt), Steuer-ID- och Personalausweis-detektering med kontrollsummevalidering, SVNR-stöd för österrikiska dokument och AHV-nummerstöd för schweiziska dokument.

Mer om flerspråkiga igenkänningsproblem finns i guiden om flerspråkig PII-detektering för GDPR-compliance. Tekniska tillsynsprioriteringar för BfDI dokumenteras i den tekniska BfDI-guiden för tyska företag. Om tyska nationella skatte-ID:n och EU-övergripande identifierare, se guiden om EU-skatte-ID PII-detektering.

Källor

Redo att skydda din data?

Börja anonymisera PII med 285+ entitetstyper på 48 språk.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.