NAIH Ungern: TAJ-Szám och GDPR:s tekniska krav
Uppdaterat för 2026
Ungerns dataskyddsmyndighet är NAIH. Myndighetens rapport 2024 visade att NER-noggrannheten för ungerska är bara 67 %. EU-genomsnittet är 82 %. Den luckan skapar verklig risk. Verktyg byggda för engelska eller tyska missar ungerska identifierare i hög utsträckning.
Varför ungersk NER presterar lågt
Tre egenskaper hos ungerska bryter sönder vanliga NLP-modeller.
Agglutination: Ungerskan fogar suffix till rotord. Samma namn tar många former i en mening. Kovács Péter i subjektsposition blir Kovács Péternek i en annan roll. NER-modeller måste koppla ihop alla dessa former till en person.
Namnordning: Ungerskan placerar efternamnet först. De flesta NLP-modeller förväntar sig förnamnet först. Den omvändningen orsakar missade identifieringar.
Specialtecken: Ungerskan använder ő och ű. Dessa är inte samma som tyska umlaut. Blandad kodning — Windows-1250 mot UTF-8 — orsakar också fel.
Dessa tre faktorer förklarar det mesta av noggrannhetsluckan i NAIH:s rapport 2024.
TAJ-Szám: Ungerns socialförsäkringsnummer
TAJ-szám (Társadalombiztosítási Azonosító Jel) är ett 9-siffrigt nummer. Det förekommer i sjukvårds-, löne-, socialbidrag- och pensionsposter.
Kontrollsumma: Multiplicera siffra 1 till 8 med vikterna 3, 7, 3, 7, 3, 7, 3, 7. Addera resultaten. Ta modulo 10. Det ger kontrollsiffran.
Denna algoritm är unik för Ungern. Den är inte densamma som Luhn-algoritmen som används i andra länder.
Generiska verktyg identifierar TAJ-szám med bara 61 % noggrannhet, enligt NAIH:s rapport 2024. Det 9-siffriga formatet liknar många andra nummer i ungerska dokument. Utan kontrollsummasteget flaggar verktyg falskt positiva och missar riktiga.
Adóazonosító Jel: Ungerns skattenummer
Adóazonosító jel är ett 10-siffrigt personligt skattenummer. Den första siffran är alltid 8. Det förekommer i anställningsposter, skattedeklarationer och finansiella dokument.
Kontrollsumma: Ta siffra 2 till 9. Multiplicera med vikterna 9, 7, 3, 1, 9, 7, 3, 1. Addera resultaten. Ta modulo 10. Det är kontrollsiffran. Ett resultat på 0 innebär att kontrollsiffran är 0.
NAIH:s tillsynsärenden visar att detta nummer ofta missas i HR-dokument när verktyg är konfigurerade för andra språk.
Se vår EU-guide till nationellt skatte-ID för hur dessa nummer jämförs mellan medlemsstater.
NAIH:s DPIA-krav för AI-system
NAIH:s vägledning 2024 kräver en genomförd konsekvensbedömning (DPIA) innan ett AI-system behandlar personuppgifter. Det är strängare än det allmänna GDPR-testet. DPIA:n måste täcka:
- Dataflöden — träningsdata, indata och utdata
- Rättslig grund — dokumenterad för varje aktivitet
- Språknoggrannhet — krävs för språk under EU-genomsnittet
- Mänsklig granskning — ett sätt att kontrollera automatiserade beslut
DPIA:n måste uppdateras varje år när systemet tränas om.
För team som driftsätter AI-verktyg på ungerska data gäller en fast ordning: DPIA först, sedan driftsättning.
Lägsta tekniska kontroller
Tre kontroller utgör baslinjen för NAIH-efterlevnad:
- TAJ-szám-detektion med modulo-10-kontrollsumma — mönstermatchning ensam räcker inte
- Adóazonosító jel-detektion med kontrollsummavalidering — avgörande för HR och ekonomi
- Ungersk NER med agglutinationsstöd — måste hantera ő, ű och kodningsvarianter
Se vår BfDI Tyskland-guide för jämförelse av hur centraleuropeiska dataskyddsmyndigheter ställer tekniska krav. För en liknande språklucka i Centraleuropa, se vår tjeckiska ÚOOÚ-guide.