Németnyelvi PII-felismerés a DSGVO-megfelelőség érdekében
Frissítve: 2026
Németország 2024-ben összesen 27 829 adatvédelmi incidenst jelentett be a BfDI-nak és a 16 tartományi adatvédelmi hatóságnak — ez új csúcs. Ez az összes EU-beli GDPR-bejelentés 31%-a. Ezek a számok nem csupán egy aktív bejelentési kultúrát tükröznek, hanem egy technikai hiányosságot is: a német vállalkozások 65%-a olyan PII-felismerő eszközöket használ, amelyek nem megfelelő szintű támogatást nyújtanak a német nyelvhez.
Háromszintű végrehajtás Németországban
A DSGVO végrehajtása Németországban összetett, és 17 hatóság között oszlik meg.
BfDI (Szövetségi adatvédelmi biztos): Hatásköre a szövetségi hatóságokra, a távközlési és postai szolgáltatókra, valamint a tartományokon átnyúló szervezetekre terjed ki.
16 tartományi adatvédelmi hatóság: Minden tartománynak saját, független végrehajtási jogkörrel rendelkező hatósága van. A legaktívabbak:
- Bajorország – BayLDA: Az EU egyik legtechnikailag igényes adatvédelmi hatósága. 2024-ben több mint 250 szervezetet auditált.
- Hamburg: Úttörő az USA-platformok elleni eljárásokban.
- Baden-Württemberg – LfDI BW: Kiadta Németország első AI-specifikus DSGVO-iránymutatását.
A németországi vállalkozásokat egyszerre ellenőrizhetik szövetségi és tartományi szinten, ami jelentősen növeli a dokumentációs terheket.
DACH-komplexitás: Három jogrendszer, egy nyelv
A DACH-térség németnyelvi szervezetei három különböző jogrendszer alatt működnek.
Németország: EU-DSGVO a BfDI és a tartományi hatóságok végrehajtásával. Specifikus azonosítók: adóazonosító szám (11 jegyű), személyigazolvány szám (10 karakter), DE formátumú IBAN.
Ausztria: EU-DSGVO a DSB végrehajtásával. Osztrák azonosítók: társadalombiztosítási szám (SVNR, 10 jegyű), eAT (elektronikus tartózkodási engedély), FinanzOnline-szám.
Svájc: revDSG (2023 szeptembere óta hatályos) — nem EU-DSGVO, de szorosan igazodik hozzá. Svájci azonosítók: AHV-szám (13 jegyű, 756.XXXX.XXXX.XX formátumban), UID (vállalati azonosítószám).
Aki mindhárom országban tevékenykedik, olyan PII-eszközre van szüksége, amely képes feldolgozni a négynyelvű szöveget és mindhárom nemzeti azonosítót. A liechtensteini DSG negyedik jogkeretként egészíti ki ezeket.
Német azonosítók részletesen
Adóazonosító szám (Steuer-ID): 11 jegyű adóazonosító, amelyet a német lakóhellyel rendelkezőknek születésüktől kiadnak. Az első jegy nem lehet nulla. A sor végén ellenőrző számjegy áll, amelyet modulo-algoritmussal számítanak. Minden német adó-, foglalkoztatási és pénzügyi dokumentumban megjelenik.
Személyigazolvány szám: Formátuma LNNNNNNNC (1 betű + 8 szám + 1 ellenőrző karakter). Az ellenőrző karaktert súlyozott összeg-algoritmus határozza meg. Minden német és Németországban lakóhellyel rendelkező EU-állampolgárnak van személyigazolvány száma.
Társadalombiztosítási szám (SV-Nummer): Formátuma NNDDMMYYAAAA (2 jegyű területi kód + születési dátum + 2 betű a vezetéknévből + ellenőrző szám). Foglalkoztatási és nyugdíjdokumentumokban használják.
Német IBAN: DE formátum: 2 ellenőrző szám + 8 jegyű bankszám (BLZ) + 10 jegyű számlaszám. Az IBAN Mod-97 ellenőrzésen túl a BLZ formátumát is ellenőrizni kell.
Egészségbiztosítási szám (KVNr): 10 jegyű szám (1 betű + 9 szám). A betű jelöli a biztosítót; a számok ellenőrző számjegyet tartalmaznak.
A 65%-os eszközhiány
A BfDI 2024-es felmérése szerint a német vállalkozások 65%-a hiányos németnyelvű támogatással rendelkező PII-eszközöket használ. Konkrét gyengeségek:
Adóazonosító felismerés: A mintaillesztés ellenőrző számjegy-validáció nélkül történik, ami sok téves találatot eredményez tetszőleges 11 jegyű számszekvenciáknál a német dokumentumokban.
Személyigazolvány felismerés: Hibák lépnek fel, amikor a formátum „Personalausweis” jelzés nélkül jelenik meg. A kontextuális felismeréshez névfelismerő (NER) modell szükséges, amely meghatározza a dokumentum típusát.
Német névfelismerés: Az angol szövegen betanított NLP-modellek gyengén ismerik fel a német neveket. Különösen érintett a kettős nevek (Hans-Wilhelm, Anna-Katharina) és az umlautos nevek (Müller, Schröder, Böhm) felismerése.
Német címformátumok: A Straße, Platz, Weg és Gasse szerkezetileg különböznek az angol címformátumoktól. Az angol elemzők rendszeresen hibákat ejtenek a német címeknél.
A BfDI, a BayLDA és más német adatvédelmi hatóságok megfelelőségi elvárása: németnyelvi NER (spaCy de_core_news vagy egyenértékű), adóazonosító és személyigazolvány felismerés összegző validációval, SVNR-támogatás az osztrák és AHV-szám-támogatás a svájci dokumentumokhoz.
A többnyelvű felismerési kihívásokról bővebben a többnyelvű PII-felismerési útmutatóban olvashat. A BfDI műszaki végrehajtási fókuszpontjait a technikai BfDI-útmutató ismerteti. A német nemzeti adóazonosítókról és az EU-szintű azonosítókról az EU adóazonosító PII-felismerési útmutató nyújt tájékoztatást.