Vokiečių kalbos ADA aptikimas BDAR atitikčiai
Atnaujinta: 2026 m.
Vokietija 2024 m. pranešė apie 27 829 duomenų apsaugos pažeidimus BfDI ir 16 žemių duomenų apsaugos institucijų - naują rekordą. Tai atitinka 31 % visų BDAR pranešimų ES. Šie skaičiai rodo ne tik aktyvią pranešimų kultūrą. Jie taip pat atskleidžia techninę spragą: 65 % Vokietijos įmonių naudoja ADA aptikimo įrankius, kurie suteikia nepakankamą vokiečių kalbos palaikymą.
Trijų pakopų vykdymas Vokietijoje
BDAR vykdymas Vokietijoje yra sudėtingas. Jis pasiskirsto 17 institucijų.
BfDI (Federalinis įgaliotinis): Atsakingas už federalines institucijas, telekomunikacijas, pašto paslaugų teikėjus ir tarpžemines organizacijas.
16 žemių duomenų apsaugos institucijų: Kiekviena žemė turi savo instituciją su nepriklausomomis vykdymo galiomis. Aktyviausi organai:
- Bavarija - BayLDA: Laikoma viena iš techniškai reikliausių duomenų apsaugos institucijų ES. 2024 m. auditavo daugiau nei 250 organizacijų.
- Hamburgas: Pirmasis ryžtingai vykdė ES atžvilgiu JAV platformų operatorius.
- Badenas-Viurtembergas - LfDI BW: Paskelbė pirmąsias Vokietijoje DI specifines BDAR gaires.
Vokietijos įmonėms gali būti taikoma federalinė ir žemės lygio kontrolė vienu metu. Tai žymiai padidina dokumentavimo poreikį.
DACH sudėtingumas: trys teisiniai pagrindai, viena kalba
Vokiečių kalbą vartojančios organizacijos DACH erdvėje dirba pagal tris skirtingus teisinius pagrindus.
Vokietija: ES BDAR su BfDI ir žemių duomenų apsaugos institucijomis. Specifiniai identifikatoriai: mokesčių identifikavimo numeris (11 skaitmenų), asmens dokumento numeris (10 simbolių), IBAN DE formatu.
Austrija: ES BDAR su DSB vykdymu. Austrijos identifikatoriai: socialinio draudimo numeris (SVNR, 10 skaitmenų), eAT (elektroninis leidimas gyventi), FinanzOnline numeris.
Šveicarija: revDSG (galioja nuo 2023 m. rugsėjo) - ne ES BDAR, bet glaudžiai su juo suderintas. Šveicarijos identifikatoriai: AHV numeris (13 skaitmenų, formatas 756.XXXX.XXXX.XX), UID (įmonės identifikavimas).
Kas veikia visose trijose šalyse, jam reikia ADA įrankio, kuris apdoroja vokiečių kalbos tekstą ir visus tris nacionalinius identifikatorius. Be to, prie to prisideda ir Lichtenšteino DSG kaip ketvirtasis pagrindas.
Vokietijos identifikatoriai iš arčiau
Mokesčių identifikavimo numeris (Steuer-ID): 11 skaitmenų mokesčių ID, suteikiamas vokiečių gyventojams nuo gimimo. Pirmasis simbolis negali būti nulis. Tikrinimo skaitmuo pabaigoje apskaičiuojamas naudojant modulo algoritmą. Pasirodo visuose vokiečių mokesčių, užimtumo ir finansiniuose dokumentuose.
Asmens dokumento numeris: Formatas LNNNNNNNC (1 raidė + 8 skaitmenys + 1 tikrinimo simbolis). Tikrinimo simbolis gaunamas naudojant svertinį sumos algoritmą. Kiekvienas Vokietijos pilietis ir ES pilietis, gyvenantis Vokietijoje, turi asmens dokumento numerį.
Socialinio draudimo numeris (SV-Nummer): Formatas NNDDMMYYAAAA (2 skaitmenų teritorijos kodas + gimimo data + 2 pavardės raidės + tikrinimo skaitmuo). Naudojamas užimtumo ir pensijų dokumentuose.
Vokiečių IBAN: Formatas DE + 2 tikrinimo skaitmenys + 8 skaitmenų banko kodas (BLZ) + 10 skaitmenų sąskaitos numeris. Be IBAN-Mod-97 tikrinimo, turi būti patikrintas ir BLZ formatas.
Sveikatos draudimo numeris (KVNr): 10 skaitmenų numeris (1 raidė + 9 skaitmenys). Raidė žymi draudiką; skaitmenys apima tikrinimo skaitmenį.
65 % įrankių spraga
Remiantis BfDI 2024 m. tyrimo duomenimis, 65 % Vokietijos įmonių naudoja ADA įrankius su nepakankama vokiečių kalbos palaikymu. Konkretūs trūkumai:
Mokesčių ID aptikimas: Šablonai sutapatinami be tikrinimo skaitmens patikrinimo. Tai sukuria daug klaidingų teigiamų rezultatų naudojant atsitiktines 11 skaitmenų skaičių sekas vokiečių dokumentuose.
Asmens dokumento aptikimas: Klaidos atsiranda, kai formatas pasirodo be aiškaus žymėjimo "Personalausweis". Kontekstinis atpažinimas reikalauja vokiečių kalbos NER, kad būtų galima teisingai nustatyti dokumento tipą.
Vokiečių vardų atpažinimas: NLP modeliai, apmokyti su anglų kalbos tekstais, prastai atpažįsta vokiečių vardus. Ypač paveikti: sudėtiniai vardai (Hans-Wilhelm, Anna-Katharina) ir umlautai (Muller, Schroder, Bohm).
Vokiečių adresų formatai: Strasse, Platz, Weg ir Gasse skiriasi struktūriškai nuo anglų adresų formatų. Anglų kalbosmis analizatoriai sistemingai klysta su vokiečių adresais.
BfDI, BayLDA ir kitų Vokietijos duomenų apsaugos institucijų atitikties standartas: vokiečių kalbos NER (spaCy de_core_news arba lygiavertis), mokesčių ID ir asmens dokumento aptikimas su kontrolinės sumos patvirtinimu, SVNR palaikymas Austrijos dokumentams ir AHV numerio palaikymas Šveicarijos dokumentams.
Daugiau apie daugiakalbius aptikimo iššūkius žr. daugiakalbio ADA aptikimo BDAR atitikčiai vadove. BfDI techniniai vykdymo prioritetai dokumentuoti techniniame BfDI vadove Vokietijos įmonėms. Dėl Vokietijos nacionalinių mokesčių ID ir ES masto identifikatorių žr. ES mokesčių ID ADA aptikimo vadovą.