Tyskspråkig PII-detektering för DSGVO-compliance
Uppdaterat 2026
Tyskland anmälde totalt 27 829 dataskyddsincidenter till BfDI och de 16 Landesdatenschutzbehörderna 2024 — ett nytt rekord. Det motsvarar 31 % av alla GDPR-anmälningar i EU. Dessa siffror visar inte bara en aktiv anmälningskultur. De visar också en teknisk lucka: 65 % av tyska företag använder PII-detekteringsverktyg med otillräckligt stöd för det tyska språket.
Trestegs tillsyn i Tyskland
GDPR-tillsynen i Tyskland är komplex och fördelad på 17 myndigheter.
BfDI (Bundesbeauftragter): Ansvarar för federala myndigheter, telekommunikation, posttjänster och organisationer som verkar över delstatsgränser.
16 Landesdatenschutzbehörden: Varje delstat har en egen myndighet med självständiga tillsynsbefogenheter. De mest aktiva:
- Bayern – BayLDA: Anses vara en av EU:s tekniskt mest krävande dataskyddsmyndigheter. Granskade över 250 organisationer 2024.
- Hamburg: Pionjär inom tillsyn mot amerikanska plattformsoperatörer.
- Baden-Württemberg – LfDI BW: Utfärdade den första AI-specifika GDPR-vägledningen i Tyskland.
Företag i Tyskland kan kontrolleras samtidigt på federal nivå och delstatsnivå, vilket avsevärt ökar dokumentationsbehoven.
DACH-komplexitet: Tre rättsliga ramverk, ett språk
Tyskspråkiga organisationer i DACH-regionen verkar under tre olika rättsliga ramverk.
Tyskland: EU-DSGVO med BfDI och Landesdatenschutzbehörden. Specifika identifierare: Steueridentifikationsnummer (11 siffror), Personalausweisnummer (10 tecken), IBAN i DE-format.
Österrike: EU-DSGVO med DSB-tillsyn. Österrikiska identifierare: Sozialversicherungsnummer (SVNR, 10 siffror), eAT (elektronischer Aufenthaltstitel), FinanzOnline-nummer.
Schweiz: revDSG (i kraft sedan september 2023) — inte EU-DSGVO, men tätt kopplat till det. Schweiziska identifierare: AHV-nummer (13 siffror, format 756.XXXX.XXXX.XX), UID (Unternehmensidentifikation).
Den som verkar i alla tre länder behöver ett PII-verktyg som hanterar tyskspråkig text och alla tre nationella identifierare. Därtill kommer Liechtensteins DSG som ett fjärde ramverk.
Tyska identifierare i detalj
Steueridentifikationsnummer (Steuer-ID): Ett 11-siffrigt skatte-ID som tilldelas tyska invånare från födseln. Första siffran får inte vara noll. En kontrollsiffra i slutet beräknas med en modulo-algoritm. Förekommer i alla tyska skatte-, anställnings- och finansdokument.
Personalausweisnummer: Format LNNNNNNNC (1 bokstav + 8 siffror + 1 kontrollsiffra). Kontrollsiffran beräknas med en viktad summaalgoritm. Varje tysk medborgare och varje EU-medborgare bosatt i Tyskland har en Personalausweisnummer.
Sozialversicherungsnummer (SV-Nummer): Format NNDDMMYYAAAA (2-siffrig regionkod + födelsedatum + 2 bokstäver från efternamnet + kontrollsiffra). Används i anställnings- och pensionsdokument.
Tysk IBAN: Format DE + 2 kontrollsiffror + 8-siffrig bankleitzahl (BLZ) + 10-siffrig kontonummer. Utöver IBAN Mod-97-kontrollen måste även BLZ-formatet valideras.
Krankenversicherungsnummer (KVNr): 10-siffrig nummer (1 bokstav + 9 siffror). Bokstaven identifierar försäkringsgivaren; siffrorna innehåller en kontrollsiffra.
De 65 %-verktygsluckan
Enligt BfDI:s undersökning 2024 använder 65 % av tyska företag PII-verktyg med bristfälligt stöd för tyska. Konkreta svagheter:
Steuer-ID-detektering: Mönster matchas utan kontrollsiffervalidering, vilket ger många falskt positiva träffar på godtyckliga 11-siffriga talsekvenser i tyska dokument.
Personalausweis-detektering: Fel uppstår när formatet förekommer utan den explicita beteckningen "Personalausweis". Kontextuell igenkänning kräver tyskspråkig NER för att korrekt fastställa dokumenttypen.
Tysk namnigenkänning: NLP-modeller tränade på engelskspråkig text identifierar tyska namn dåligt. Särskilt drabbade är sammansatta namn (Hans-Wilhelm, Anna-Katharina) och namn med umlaut (Müller, Schröder, Böhm).
Tyska adressformat: Straße, Platz, Weg och Gasse skiljer sig strukturellt från engelska adressformat. Engelska parsers ger systematiska fel vid tyska adresser.
Compliancestandarden för BfDI, BayLDA och andra tyska dataskyddsmyndigheter är: tyskspråkig NER (spaCy de_core_news eller likvärdigt), Steuer-ID- och Personalausweis-detektering med kontrollsummevalidering, SVNR-stöd för österrikiska dokument och AHV-nummerstöd för schweiziska dokument.
Mer om flerspråkiga igenkänningsproblem finns i guiden om flerspråkig PII-detektering för GDPR-compliance. Tekniska tillsynsprioriteringar för BfDI dokumenteras i den tekniska BfDI-guiden för tyska företag. Om tyska nationella skatte-ID:n och EU-övergripande identifierare, se guiden om EU-skatte-ID PII-detektering.