Tyskspråkig PII-detektering för DSGVO-compliance

Uppdaterat 2026

Tyskland anmälde totalt 27 829 dataskyddsincidenter till BfDI och de 16 Landesdatenschutzbehörderna 2024 — ett nytt rekord. Det motsvarar 31 % av alla GDPR-anmälningar i EU. Dessa siffror visar inte bara en aktiv anmälningskultur. De visar också en teknisk lucka: 65 % av tyska företag använder PII-detekteringsverktyg med otillräckligt stöd för det tyska språket.

Trestegs tillsyn i Tyskland

GDPR-tillsynen i Tyskland är komplex och fördelad på 17 myndigheter.

BfDI (Bundesbeauftragter): Ansvarar för federala myndigheter, telekommunikation, posttjänster och organisationer som verkar över delstatsgränser.

16 Landesdatenschutzbehörden: Varje delstat har en egen myndighet med självständiga tillsynsbefogenheter. De mest aktiva:

Bayern – BayLDA: Anses vara en av EU:s tekniskt mest krävande dataskyddsmyndigheter. Granskade över 250 organisationer 2024.
Hamburg: Pionjär inom tillsyn mot amerikanska plattformsoperatörer.
Baden-Württemberg – LfDI BW: Utfärdade den första AI-specifika GDPR-vägledningen i Tyskland.

Företag i Tyskland kan kontrolleras samtidigt på federal nivå och delstatsnivå, vilket avsevärt ökar dokumentationsbehoven.

DACH-komplexitet: Tre rättsliga ramverk, ett språk

Tyskspråkiga organisationer i DACH-regionen verkar under tre olika rättsliga ramverk.

Tyskland: EU-DSGVO med BfDI och Landesdatenschutzbehörden. Specifika identifierare: Steueridentifikationsnummer (11 siffror), Personalausweisnummer (10 tecken), IBAN i DE-format.

Österrike: EU-DSGVO med DSB-tillsyn. Österrikiska identifierare: Sozialversicherungsnummer (SVNR, 10 siffror), eAT (elektronischer Aufenthaltstitel), FinanzOnline-nummer.

Schweiz: revDSG (i kraft sedan september 2023) — inte EU-DSGVO, men tätt kopplat till det. Schweiziska identifierare: AHV-nummer (13 siffror, format 756.XXXX.XXXX.XX), UID (Unternehmensidentifikation).

Den som verkar i alla tre länder behöver ett PII-verktyg som hanterar tyskspråkig text och alla tre nationella identifierare. Därtill kommer Liechtensteins DSG som ett fjärde ramverk.

Tyska identifierare i detalj

Steueridentifikationsnummer (Steuer-ID): Ett 11-siffrigt skatte-ID som tilldelas tyska invånare från födseln. Första siffran får inte vara noll. En kontrollsiffra i slutet beräknas med en modulo-algoritm. Förekommer i alla tyska skatte-, anställnings- och finansdokument.

Personalausweisnummer: Format LNNNNNNNC (1 bokstav + 8 siffror + 1 kontrollsiffra). Kontrollsiffran beräknas med en viktad summaalgoritm. Varje tysk medborgare och varje EU-medborgare bosatt i Tyskland har en Personalausweisnummer.

Sozialversicherungsnummer (SV-Nummer): Format NNDDMMYYAAAA (2-siffrig regionkod + födelsedatum + 2 bokstäver från efternamnet + kontrollsiffra). Används i anställnings- och pensionsdokument.

Tysk IBAN: Format DE + 2 kontrollsiffror + 8-siffrig bankleitzahl (BLZ) + 10-siffrig kontonummer. Utöver IBAN Mod-97-kontrollen måste även BLZ-formatet valideras.

Krankenversicherungsnummer (KVNr): 10-siffrig nummer (1 bokstav + 9 siffror). Bokstaven identifierar försäkringsgivaren; siffrorna innehåller en kontrollsiffra.

De 65 %-verktygsluckan

Enligt BfDI:s undersökning 2024 använder 65 % av tyska företag PII-verktyg med bristfälligt stöd för tyska. Konkreta svagheter:

Steuer-ID-detektering: Mönster matchas utan kontrollsiffervalidering, vilket ger många falskt positiva träffar på godtyckliga 11-siffriga talsekvenser i tyska dokument.

Personalausweis-detektering: Fel uppstår när formatet förekommer utan den explicita beteckningen "Personalausweis". Kontextuell igenkänning kräver tyskspråkig NER för att korrekt fastställa dokumenttypen.

Tysk namnigenkänning: NLP-modeller tränade på engelskspråkig text identifierar tyska namn dåligt. Särskilt drabbade är sammansatta namn (Hans-Wilhelm, Anna-Katharina) och namn med umlaut (Müller, Schröder, Böhm).

Tyska adressformat: Straße, Platz, Weg och Gasse skiljer sig strukturellt från engelska adressformat. Engelska parsers ger systematiska fel vid tyska adresser.

Compliancestandarden för BfDI, BayLDA och andra tyska dataskyddsmyndigheter är: tyskspråkig NER (spaCy de_core_news eller likvärdigt), Steuer-ID- och Personalausweis-detektering med kontrollsummevalidering, SVNR-stöd för österrikiska dokument och AHV-nummerstöd för schweiziska dokument.

Mer om flerspråkiga igenkänningsproblem finns i guiden om flerspråkig PII-detektering för GDPR-compliance. Tekniska tillsynsprioriteringar för BfDI dokumenteras i den tekniska BfDI-guiden för tyska företag. Om tyska nationella skatte-ID:n och EU-övergripande identifierare, se guiden om EU-skatte-ID PII-detektering.

Källor

Relaterade Artiklar

GDPR & Efterlevnad

Redo att skydda din data?

Börja anonymisera PII med 285+ entitetstyper på 48 språk.

Börja Gratis Provperiod Visa Funktioner

Tysk PII-detektering för DSGVO-compliance

Tyskspråkig PII-detektering för DSGVO-compliance

Trestegs tillsyn i Tyskland

DACH-komplexitet: Tre rättsliga ramverk, ett språk

Tyska identifierare i detalj

De 65 %-verktygsluckan

Källor

Relaterade Artiklar

Självdrift av PII misslyckas med efterlevnadsrevisioner

Presidio missar 220+ GDPR-entiteter

Konfigurationsdrift: En dold GDPR-risk

Redo att skydda din data?

Tysk PII-detektering för DSGVO-compliance

Tyskspråkig PII-detektering för DSGVO-compliance

Trestegs tillsyn i Tyskland

DACH-komplexitet: Tre rättsliga ramverk, ett språk

Tyska identifierare i detalj

De 65 %-verktygsluckan

Källor

Relaterade Artiklar

Självdrift av PII misslyckas med efterlevnadsrevisioner

Presidio missar 220+ GDPR-entiteter

Konfigurationsdrift: En dold GDPR-risk

Redo att skydda din data?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow