NAIH Hongarye: TAJ-Szam en GDPR-tegniese Vereistes
Opgedateer vir 2026
Hongarye se dataowerheid is NAIH. Sy 2024-verslag het gevind dat NER-akkuraatheid vir Hongaars slegs 67% is. Die EU-gemiddeld is 82%. Hierdie gaping skep werklike risiko. Instrumente wat vir Engels of Duits gebou is, mis Hongaarse identifiseerders teen hoe koerse.
Hoekom Hongaarse NER Laag Aangeteken Word
Drie kenmerke van Hongaars breek standaard NLP-modelle.
Agglutinasie: Hongaars voeg agtervoegsels by wortelwoorde. Dieselfde naam neem baie vorms in 'n sin aan. "Kovacs Peter" in subjekposisie word "Kovacs Peternek" in 'n ander rol. NER-modelle moet al hierdie vorms aan een persoon koppel.
Naamvolgorde: Hongaars stel die familienaam eerste. Die meeste NLP-modelle verwag eerste naam eerste. Hierdie omgekeerde volgorde veroorsaak gemiste opsporings.
Spesiale karakters: Hongaars gebruik o met dubbelaksent en u met dubbelaksent. Dit is nie dieselfde as Duitse umlaut nie. Gemengde kodering - Windows-1250 teenoor UTF-8 - veroorsaak ook mislukkings.
Hierdie drie faktore verklaar die meeste van die akkuraatheidsgaping in NAIH se 2024-verslag.
TAJ-Szam: Hongarye se Sosiale Sekerheids-nommer
Die TAJ-szam (Tarsadalombiztositasi Azonosito Jel) is 'n 9-syfer-nommer. Dit verskyn in gesondheidsorg-, salaris-, maatskaplike voordele- en pensioenrekords.
Kontrolesom: Vermenigvuldig syfers 1 tot 8 met gewigte 3, 7, 3, 7, 3, 7, 3, 7. Tel die resultate op. Neem modulo 10. Dit gee die toetssyfer.
Hierdie algoritme is uniek aan Hongarye. Dit is nie dieselfde as die Luhn-algoritme wat in ander lande gebruik word nie.
Generiese instrumente spoor TAJ-szam met slegs 61% akkuraatheid op, volgens die NAIH 2024-verslag. Die 9-syfer-formaat lyk soos baie ander nommers in Hongaarse dokumente. Sonder die kontrolesom-stap merk instrumente vals positiewe en mis werklike nommers.
Adoazonosito Jel: Hongarye se Belasting-ID
Die adoazonosito jel is 'n 10-syfer persoonlike belastingnommer. Die eerste syfer is altyd 8. Dit verskyn in indiensnemingsrekords, belastingliasserings en finansiele dokumente.
Kontrolesom: Neem syfers 2 tot 9. Vermenigvuldig met gewigte 9, 7, 3, 1, 9, 7, 3, 1. Tel die resultate op. Neem modulo 10. Dit is die toetssyfer. 'n Resultaat van 0 beteken die toetssyfer is 0.
NAIH-handhawingsgevalle toon dat hierdie nommer dikwels in HR-dokumente gemis word wanneer instrumente vir ander tale opgestel is.
Sien ons EU nasionale belasting-ID-gids vir hoe hierdie nommers oor lidstate vergelyk.
NAIH se DPIA-vereiste vir KI-stelsels
NAIH se 2024-leiding vereis 'n voltooide DPIA voor enige KI-stelsel persoonlike data verwerk. Dit is strenger as die algemene GDPR-toets. Die DPIA moet dek:
- Datavloei - opleidingsdata, insette en uitsette
- Regsbasis - gedokumenteer vir elke aktiwiteit
- Taalakkuraatheid - vereis vir tale onder die EU-gemiddeld
- Menslike hersiening - 'n manier om geoutomatiseerde besluite te kontroleer
Die DPIA moet elke jaar opgedateer word wanneer die stelsel opgelei word.
Vir spanne wat KI-instrumente op Hongaarse data ontplooi, is die volgorde vas: DPIA eerste, dan ontplooiing.
Minimum Tegniese Beheermaatreels
Drie beheermaatreels vorm die basislyn vir NAIH-nakoming:
- TAJ-szam-opsporing met modulo-10-kontrolesom - patroonmassering alleen is nie genoeg nie
- Adoazonosito jel-opsporing met kontrolesom-validasie - krities vir HR en finansies
- Hongaarse NER met agglutinasie-ondersteuning - moet o met dubbelaksent, u met dubbelaksent en koderingsvariante hanteer
Sien ons BFDI Duitsland-gids om te vergelyk hoe Sentraal-Europese DPA's tegniese vereistes stel. Vir 'n soortgelyke taalkloof in Sentraal-Europa, sien ons Tsjeggiese UOOU-gids.