NAIH Ungarn: TAJ-szám og GDPR tekniske krav
Opdateret til 2026
Ungarns datatilsyn hedder NAIH. Dens rapport fra 2024 viste, at NER-nøjagtighed for ungarsk kun er 67%. EU-gennemsnittet er 82%. Det gab skaber reel risiko. Værktøjer bygget til engelsk eller tysk overser ungarske identifikatorer i høj grad.
Hvorfor ungarsk NER scorer lavt
Tre træk ved ungarsk bryder standardiserede NLP-modeller.
Agglutination: Ungarsk tilføjer suffikser til rodord. Det samme navn antager mange former i en sætning. "Kovács Péter" som subjekt bliver "Kovács Péternek" i en anden grammatisk rolle. NER-modeller skal koble alle disse former til én person.
Navnerækkefølge: Ungarsk sætter efternavnet først. De fleste NLP-modeller forventer fornavn først. Denne ombytning fører til oversete detektioner.
Specialtegn: Ungarsk bruger ő og ű, som ikke er det samme som tyske omlauts. Blandet kodning — Windows-1250 vs. UTF-8 — forårsager også fejl.
Disse tre faktorer forklarer størstedelen af nøjagtigheedsgabet i NAIHs rapport fra 2024.
TAJ-szám: Ungarns sociale sikringsnummer
TAJ-szám (Társadalombiztosítási Azonosító Jel) er et 9-cifret nummer, der optræder i sundhedsregistre, lønregistre, sociale ydelser og pensionsregistre.
Kontrolsum: Gang cifrene 1 til 8 med vægterne 3, 7, 3, 7, 3, 7, 3, 7. Læg resultaterne sammen. Tag modulo 10. Det giver kontrolcifferet.
Denne algoritme er unik for Ungarn. Den er ikke den samme som Luhn-algoritmen, der bruges i andre lande.
Generiske værktøjer detekterer TAJ-szám med kun 61% nøjagtighed ifølge NAIHs rapport fra 2024. Det 9-cifrede format ligner mange andre tal i ungarske dokumenter. Uden kontrolsumstrinnet markerer værktøjer falske positiver og overser rigtige.
Adóazonosító jel: Ungarns skatte-ID
Adóazonosító jel er et 10-cifret personligt skattenummer. Det første ciffer er altid 8. Det optræder i ansættelsesregistre, selvangivelser og finansielle dokumenter.
Kontrolsum: Tag cifrene 2 til 9. Gang med vægterne 9, 7, 3, 1, 9, 7, 3, 1. Læg resultaterne sammen. Tag modulo 10. Det er kontrolcifferet. Et resultat på 0 betyder, at kontrolcifferet er 0.
NAIHs håndhævelsessager viser, at dette nummer ofte overses i HR-dokumenter, når værktøjer er konfigureret til andre sprog.
Se vores EU-nationale skatte-ID-guide for, hvordan disse numre sammenligner sig på tværs af medlemsstaterne.
NAIHs DPIA-krav til AI-systemer
NAIHs vejledning fra 2024 kræver en færdiggjort DPIA, inden ethvert AI-system behandler personoplysninger. Det er strengere end den generelle GDPR-test. DPIA'en skal dække:
- Datastrømme — træningsdata, input og output
- Retsgrundlag — dokumenteret for hver aktivitet
- Sprognøjagtighed — påkrævet for sprog under EU-gennemsnittet
- Menneskelig gennemgang — en metode til at kontrollere automatiserede beslutninger
DPIA'en skal opdateres hvert år, når systemet genoptrænes.
For teams, der implementerer AI-værktøjer på ungarske data, er rækkefølgen fast: DPIA først, derefter implementering.
Tekniske minimumskontroller
Tre kontroller udgør grundlinjen for NAIH-overholdelse:
- TAJ-szám-detektion med modulo-10-kontrolsum — mønstermatchning alene er ikke tilstrækkeligt
- Adóazonosító jel-detektion med kontrolsumvalidering — afgørende for HR og økonomi
- Ungarsk NER med agglutinationsunderstøttelse — skal håndtere ő, ű og kodningsvarianter
Se vores BfDI Tyskland-guide for at sammenligne, hvordan mellemeuropæiske databeskyttelsesmyndigheder stiller tekniske krav. For et lignende sprognøjagtighedsgab i Mellemeuropa, se vores tjekkiske ÚOOÚ-guide.