By · Last updated 2026-06-05

Tilbage til BlogGDPR & Overholdelse

Tysk PII-detektion til DSGVO-compliance

BfDI indberettede 27.829 brudanmeldelser i 2024 — Tysklands rekord nogensinde. 65 % af tyske virksomheder bruger værktøjer med utilstrækkelig tysk PII-understøttelse.

June 5, 20269 min læsning
Germany BfDIDACH complianceSteuer-ID detectionGerman language PIIDSGVO technical

Tysksproget PII-detektion til DSGVO-compliance

Stand: 2026

Tyskland indberettede i 2024 i alt 27.829 databrud til BfDI og de 16 delstats-databeskyttelsesmyndigheder — en ny rekord. Det svarer til 31 % af alle DSGVO-anmeldelser i EU. Disse tal afspejler ikke blot en aktiv indberetningskultur. De afslører også en teknisk mangel: 65 % af tyske virksomheder bruger PII-detektionsværktøjer med utilstrækkelig understøttelse af det tyske sprog.

Trestrenget håndhævelse i Tyskland

DSGVO-håndhævelse i Tyskland er kompleks. Den fordeler sig på 17 myndigheder.

BfDI (Bundesbeauftragter): Ansvarlig for forbundsmyndigheder, telekommunikation, posttjenester og delstatsoverskridende organisationer.

16 delstatsdatabeskyttelsesmyndigheder: Hvert delstat har sin egen myndighed med uafhængige håndhævelsesbeføjelser. De mest aktive myndigheder:

  • Bayern – BayLDA: Betragtes som en af de teknisk mest krævende databeskyttelsesmyndigheder i EU. Auditerede over 250 organisationer i 2024.
  • Hamburg: Pioner i håndhævelse over for amerikanske platformsoperatører.
  • Baden-Württemberg – LfDI BW: Udstedte den første AI-specifikke DSGVO-vejledning i Tyskland.

Virksomheder i Tyskland kan kontrolleres på både forbunds- og delstatsniveau samtidigt. Det øger dokumentationsbehovet markant.

DACH-kompleksitet: Tre retsrammer, ét sprog

Tysktalende organisationer i DACH-regionen arbejder under tre forskellige retsrammer.

Tyskland: EU-DSGVO med BfDI og delstatsdatabeskyttelsesmyndigheder. Specifikke identifikatorer: Steueridentifikationsnummer (11 cifre), Personalausweisnummer (10 tegn), IBAN i DE-format.

Østrig: EU-DSGVO med DSB-håndhævelse. Østrigske identifikatorer: Sozialversicherungsnummer (SVNR, 10 cifre), eAT (elektronisk opholdstilladelse), FinanzOnline-nummer.

Schweiz: revDSG (i kraft siden september 2023) — ikke EU-DSGVO, men tæt tilpasset den. Schweiziske identifikatorer: AHV-Nummer (13 cifre, format 756.XXXX.XXXX.XX), UID (virksomhedsidentifikation).

Den, der opererer i alle tre lande, har brug for et PII-værktøj, der behandler tysksproget tekst og alle tre nationale identifikatorer. Hertil kommer Liechtensteins DSG som en fjerde ramme.

Tyske identifikatorer i detaljer

Steueridentifikationsnummer (Steuer-ID): 11-cifret skat-ID tildelt tyske beboere fra fødslen. Første ciffer må ikke være nul. Et kontrolciffer i slutningen beregnes via en modulo-algoritme. Forekommer i alle tyske skatte-, beskæftigelses- og finansdokumenter.

Personalausweisnummer: Format LNNNNNNNC (1 bogstav + 8 cifre + 1 kontroltegn). Kontroltegnet stammer fra en vægtet sumalgoritme. Enhver tysk statsborger og enhver EU-borger med bopæl i Tyskland har et Personalausweisnummer.

Sozialversicherungsnummer (SV-Nummer): Format NNDDMMYYAAAA (2-cifret områdekode + fødselsdato + 2 bogstaver fra efternavnet + kontrolciffer). Bruges i beskæftigelses- og pensionsdokumenter.

Tysk IBAN: Format DE + 2 kontrolcifre + 8-cifret bankleitzahl (BLZ) + 10-cifret kontonummer. Ud over IBAN-Mod-97-kontrollen skal BLZ-formatet også valideres.

Krankenversicherungsnummer (KVNr): 10-cifret nummer (1 bogstav + 9 cifre). Bogstavet identificerer forsikringsgiveren; cifrene indeholder et kontrolciffer.

Den 65-procents-værktøjsmanko

Ifølge BfDI-undersøgelsen fra 2024 bruger 65 % af tyske virksomheder PII-værktøjer med mangelfuld tyskunderstøttelse. Konkrete svagheder:

Steuer-ID-detektion: Mønstre matches uden validering af kontrolciffer. Det producerer mange falske positiver ved vilkårlige 11-cifrede talsekvenser i tyske dokumenter.

Personalausweis-detektion: Fejl opstår, når formatet forekommer uden den eksplicitte betegnelse "Personalausweis". Kontekstuel genkendelse kræver tysksproget NER for korrekt at fastslå dokumenttypen.

Tyske navne-NER: NLP-modeller trænet på engelsksprogede tekster genkender tyske navne dårligt. Særligt berørt: sammensatte navne (Hans-Wilhelm, Anna-Katharina) og omlyd (Müller, Schröder, Böhm).

Tyske adresseformater: Straße, Platz, Weg og Gasse adskiller sig strukturelt fra engelske adresseformater. Engelske parsere producerer systematiske fejl ved tyske adresser.

Compliance-standarden for BfDI, BayLDA og andre tyske databeskyttelsesmyndigheder er: tysksproget NER (spaCy de_core_news eller tilsvarende), Steuer-ID- og Personalausweis-detektion med kontrolsumvalidering, SVNR-understøttelse til østrigske dokumenter og AHV-nummer-understøttelse til schweiziske dokumenter.

Mere om flersprogede detektionsproblemer findes i vejledningen om flersproget PII-detektion til DSGVO-compliance. Tekniske håndhævelsesfokuspunkter for BfDI er dokumenteret i den tekniske BfDI-vejledning til tyske virksomheder. Vedrørende tyske nationale skat-ID'er og EU-dækkende identifikatorer se vejledningen om EU national skat-ID PII-detektion.

Kilder

Klar til at beskytte dine data?

Begynd at anonymisere PII med 285+ enhedstyper på tværs af 48 sprog.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.