NAIH Hongarije: TAJ-Szám en GDPR technische vereisten
Bijgewerkt voor 2026
De Hongaarse gegevensbeschermingsautoriteit is NAIH. Uit het rapport van 2024 blijkt dat de NER-nauwkeurigheid voor Hongaars slechts 67% bedraagt. Het EU-gemiddelde is 82%. Dit verschil brengt reëel risico met zich mee. Tools die zijn gebouwd voor Engels of Duits missen Hongaarse identifiers in hoge mate.
Waarom Hongaars NER laag scoort
Drie kenmerken van het Hongaars breken standaard NLP-modellen.
Agglutinatie: Hongaars voegt achtervoegsels toe aan basiswoorden. Dezelfde naam krijgt in een zin vele vormen. "Kovács Péter" in de onderwerpsrol wordt in een andere rol "Kovács Péternek". NER-modellen moeten al die vormen aan één persoon koppelen.
Naamsvolgorde: Hongaars plaatst de familienaam vooraan. De meeste NLP-modellen verwachten de voornaam eerst. Die omgekeerde volgorde leidt tot gemiste detecties.
Speciale tekens: Hongaars gebruikt ő en ű. Dit zijn niet dezelfde tekens als Duitse umlauten. Gemengde codering — Windows-1250 versus UTF-8 — veroorzaakt eveneens fouten.
Deze drie factoren verklaren het grootste deel van het nauwkeurigheidsverschil in het NAIH-rapport van 2024.
TAJ-Szám: Hongaars burgerservicenummer
Het TAJ-szám (Társadalombiztosítási Azonosító Jel) is een negencijferig nummer. Het komt voor in gezondheidszorg, salarisadministratie, sociale uitkeringen en pensioengegevens.
Controlesom: Vermenigvuldig de cijfers 1 tot en met 8 met de gewichten 3, 7, 3, 7, 3, 7, 3, 7. Tel de resultaten op. Neem modulo 10. Dat geeft het controlecijfer.
Dit algoritme is uniek voor Hongarije. Het is niet hetzelfde als het Luhn-algoritme dat in andere landen wordt gebruikt.
Generieke tools detecteren het TAJ-szám met slechts 61% nauwkeurigheid, aldus het NAIH-rapport van 2024. Het negencijferige formaat lijkt op veel andere nummers in Hongaarse documenten. Zonder de controlesomstap produceren tools zowel valse positieven als gemiste detecties.
Adóazonosító Jel: Hongaars fiscaal identificatienummer
Het adóazonosító jel is een persoonlijk belastingnummer van tien cijfers. Het eerste cijfer is altijd 8. Het komt voor in personeelsdossiers, belastingaangiften en financiële documenten.
Controlesom: Neem de cijfers 2 tot en met 9. Vermenigvuldig met de gewichten 9, 7, 3, 1, 9, 7, 3, 1. Tel de resultaten op. Neem modulo 10. Dat is het controlecijfer. Een uitkomst van 0 betekent dat het controlecijfer 0 is.
Uit NAIH-handhavingszaken blijkt dat dit nummer regelmatig wordt gemist in HR-documenten wanneer tools zijn ingesteld voor andere talen.
Zie onze gids voor EU nationale belasting-ID's voor een vergelijking van deze nummers door de lidstaten heen.
NAIH's DPIA-vereiste voor AI-systemen
De NAIH-richtlijn van 2024 vereist een voltooide DPIA voordat een AI-systeem persoonsgegevens verwerkt. Dit is strenger dan de algemene GDPR-toets. De DPIA moet betrekking hebben op:
- Gegevensstromen — trainingsgegevens, invoer en uitvoer
- Rechtsgrond — gedocumenteerd voor elke activiteit
- Taalnauwkeurigheid — vereist voor talen die onder het EU-gemiddelde scoren
- Menselijke controle — een manier om geautomatiseerde beslissingen te toetsen
De DPIA moet jaarlijks worden bijgewerkt wanneer het systeem opnieuw wordt getraind.
Voor teams die AI-tools inzetten op Hongaarse gegevens geldt een vaste volgorde: eerst de DPIA, dan de implementatie.
Minimale technische maatregelen
Drie maatregelen vormen de minimale basis voor NAIH-naleving:
- TAJ-szám-detectie met modulo-10 controlesom — patroonherkenning alleen is niet voldoende
- Adóazonosító jel-detectie met controlesomvalidatie — cruciaal voor HR en financiën
- Hongaars NER met ondersteuning voor agglutinatie — moet ő, ű en coderingsvariant aan kunnen
Zie onze BFDI Duitsland-gids voor een vergelijking van hoe Midden-Europese toezichthouders technische vereisten stellen. Voor een vergelijkbare taalkloof in Centraal-Europa, zie onze Tsjechische ÚOOÚ-gids.