Saksakeelne PII tuvastamine DSGVO vastavuse jaoks

Seisuga: 2026

Saksamaa teatas 2024. aastal kokku 27 829 andmekaitse rikkumisest BfDI-le ja 16 liidumaade andmekaitseasutustele - uus kõigi aegade rekord. See moodustab 31% kõigist DSGVO teadetest EL-is. Need numbrid ei näita ainult aktiivset teatamiskultuuri. Need näitavad ka tehnilist lünka: 65% Saksa ettevõtetest kasutab PII tuvastamise tööriistu, mis pakuvad ebapiisavat tuge saksa keelele.

Kolmetasandiline jõustamine Saksamaal

DSGVO jõustamine Saksamaal on keeruline. See jaguneb 17 asutuse vahel.

BfDI (Bundesbeauftragter): Vastutav liiduasutuste, telekommunikatsiooni, postiteenuste pakkujate ja liidumaadeüleste organisatsioonide eest.

16 liidumaade andmekaitseasutust: Igal liidumaadel on oma asutus sõltumatute jõustamisvolitustega. Aktiivsemad asutused:

Bayern - BayLDA: Peetakse üheks EL-i tehniliselt nõudlikumaks andmekaitseasutuseks. Auditas 2024. aastal üle 250 organisatsiooni.
Hamburg: Teerajaja USA platvormidega seotud jõustamises.
Baden-Wurttemberg - LfDI BW: Andis välja esimese AI-spetsiifilise DSGVO suunise Saksamaal.

Saksamaa ettevõtteid saab kontrollida korraga nii föderaal- kui ka liidumaade tasandil. See suurendab dokumenteerimisnõudeid märkimisväärselt.

DACH keerukus: kolm õigusraamistikku, üks keel

Saksakeelsed organisatsioonid DACH piirkonnas töötavad kolme erineva õigusraamistiku all.

Saksamaa: EL-i DSGVO koos BfDI ja liidumaade andmekaitseasutustega. Spetsiifilised identifikaatorid: maksuidentifitseerimisnumber (11 numbrit), isikutunnistuse number (10 tähemärki), IBAN DE-formaadis.

Austria: EL-i DSGVO DSB jõustamisega. Austria identifikaatorid: sotsiaalkindlustusnumber (SVNR, 10 numbrit), eAT (elektrooniline elamisluba), FinanzOnline-number.

Sveits: revDSG (jõustus 2023. aasta septembris) - mitte EL-i DSGVO, kuid tihedalt sellele tuginev. Šveitsi identifikaatorid: AHV-number (13 numbrit, formaat 756.XXXX.XXXX.XX), UID (ettevõtte identifitseerimine).

Kes tegutseb kõigis kolmes riigis, vajab PII tööriista, mis töötleb saksakeelset teksti ja kõiki kolme riiklikku identifikaatorit. Lisaks tuleb arvestada Liechtensteini DSG-d neljanda raamistikuna.

Saksa identifikaatorid lähemalt

Maksuidentifitseerimisnumber (Steuer-ID): 11-kohaline maksuisikukood, mis antakse Saksa elanikele sünnist alates. Esimene number ei tohi olla null. Lõpus olev kontrollnumber arvutatakse modulo-algoritmi abil. Esineb kõigis Saksa maksu-, tööhõive- ja finantsdokumentides.

Isikutunnistuse number: Formaat LNNNNNNNC (1 täht + 8 numbrit + 1 kontrollmärk). Kontrollmärk tuleneb kaalutud summa algoritmist. Igal Saksa kodanikul ja igal EL-i kodanikul, kes elab Saksamaal, on isikutunnistuse number.

Sotsiaalkindlustusnumber (SV-Nummer): Formaat NNDDMMYYAAAA (2-kohaline piirkonnakood + sünnikuupäev + 2 perekonnanime tähte + kontrollnumber). Kasutatakse tööhõive- ja pensionidokumentides.

Saksa IBAN: Formaat DE + 2 kontrollnumbrit + 8-kohaline pangakood (BLZ) + 10-kohaline kontonumber. Lisaks IBAN Mod-97 kontrollile tuleb valideerida ka BLZ formaat.

Ravikindlustusnumber (KVNr): 10-kohaline number (1 täht + 9 numbrit). Täht identifitseerib kindlustaja; numbrid sisaldavad kontrollnumbrit.

65-protsendiline tööriista lünk

BfDI 2024. aasta uuringu kohaselt kasutab 65% Saksa ettevõtetest PII tööriistu, millel on puudulik saksa tugi. Konkreetsed nõrkused:

Steuer-ID tuvastamine: Mustreid sobitletakse ilma kontrollnumbri valideerimiseta. See tekitab palju valepositiivseid tulemusi suvalisel 11-kohaliste numbrijadade puhul saksa dokumentides.

Isikutunnistuse tuvastamine: Vead tekivad, kui formaat esineb ilma selge märgistuseta "Personalausweis". Kontekstuaalne tuvastamine nõuab saksakeelset NER-i dokumenditüübi korrektseks tuvastamiseks.

Saksa nimede tuvastamine: Ingliskeelsetel tekstidel treenitud NLP mudelid tuvastavad saksa nimesid halvasti. Eriti mõjutavad: liitnimedega (Hans-Wilhelm, Anna-Katharina) ja umlautidega (Muller, Schroder, Bohm).

Saksa aadressiformaadid: Strasse, Platz, Weg ja Gasse erinevad strukturaalselt inglise aadressiformaatidest. Inglise sõelujad tekitavad saksa aadressidel süstemaatilisi vigu.

DSGVO vastavuse standard BfDI, BayLDA ja teiste Saksa andmekaitseasutuste jaoks: saksakeelne NER (spaCy de_core_news või samavariane), Steuer-ID ja isikutunnistuse tuvastamine kontrollsumma valideerimisega, SVNR tugi Austria dokumentidele ja AHV-numbri tugi Šveitsi dokumentidele.

Rohkem mitmekeelsetest tuvastamise probleemidest leiate mitmekeelse PII tuvastamise juhendist DSGVO vastavuse jaoks. BfDI tehnilised jõustamise rõhuasetused on dokumenteeritud tehnilises BfDI juhendis Saksa ettevõtetele. Saksa riiklike maksu-ID-de ja EL-i laiuste identifikaatorite kohta vaadake EL-i maksu-ID PII tuvastamise juhendit.

Allikad

Seotud Artiklid

GDPR ja Vastavus

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.

Alusta Tasuta Katset Vaata Funktsioone

Saksakeelne PII tuvastamine DSGVO vastavuse jaoks