NAIH Maďarsko: TAJ-szám a technické požadavky GDPR
Aktualizováno pro rok 2026
Maďarský úřad pro ochranu dat je NAIH. Jeho zpráva z roku 2024 zjistila, že přesnost NER pro maďarštinu dosahuje pouze 67 %. Průměr EU je 82 %. Tato mezera představuje reálné riziko. Nástroje vytvořené pro angličtinu nebo němčinu přehlíží maďarské identifikátory s vysokou četností.
Proč NER skóruje u maďarštiny nízko
Tři rysy maďarštiny narušují standardní modely NLP.
Aglutinace: Maďarština přidává přípony ke kořenovým slovům. Stejné jméno má v jedné větě mnoho podob. „Kovács Péter” v podmětové pozici se v jiné roli stává „Kovács Péternek”. Modely NER musejí propojit všechny tyto formy s jednou osobou.
Pořadí jmen: Maďarština uvádí příjmení jako první. Většina modelů NLP očekává nejprve jméno. Toto obrácení pořadí způsobuje přehlédnutí.
Speciální znaky: Maďarština používá ő a ű. Ty nejsou totožné s německými přehláskou. Smíšené kódování — Windows-1250 oproti UTF-8 — také způsobuje selhání.
Tyto tři faktory vysvětlují většinu přesnostní mezery ve zprávě NAIH z roku 2024.
TAJ-szám: Maďarské číslo sociálního pojištění
TAJ-szám (Társadalombiztosítási Azonosító Jel) je 9místné číslo. Vyskytuje se v záznámech zdravotní péče, mzdách, sociálních dávkách a důchodových záznamech.
Kontrolní součet: Číslice 1 až 8 se vynásobí vahami 3, 7, 3, 7, 3, 7, 3, 7. Výsledky se sečtou. Výsledek se vydělí modulo 10. To dá kontrolní číslici.
Tento algoritmus je jedinečný pro Maďarsko. Není totožný s algoritmem Luhn používaným v jiných zemích.
Obecné nástroje detekují TAJ-szám s přesností pouhých 61 %, jak uvádí zpráva NAIH z roku 2024. 9místný formát vypadá podobně jako mnoho jiných čísel v maďarských dokumentech. Bez kroku kontrolního součtu nástroje označují falešně pozitivní výsledky a přehlíží skutečné.
Adóazonosító jel: Maďarské daňové identifikační číslo
Adóazonosító jel je 10místné osobní daňové číslo. První číslice je vždy 8. Vyskytuje se v pracovních záznamech, daňových přiznáních a finančních dokumentech.
Kontrolní součet: Číslice 2 až 9 se vynásobí vahami 9, 7, 3, 1, 9, 7, 3, 1. Výsledky se sečtou. Výsledek se vydělí modulo 10. To je kontrolní číslice. Výsledek 0 znamená, že kontrolní číslice je 0.
Případy vymáhání NAIH ukazují, že toto číslo je v HR dokumentech often přehlédnuto, pokud jsou nástroje nastaveny pro jiné jazyky.
Viz náš průvodce národními daňovými ID v EU pro srovnání těchto čísel napříč členskými státy.
Požadavek NAIH na DPIA pro systémy AI
Pokyny NAIH z roku 2024 vyžadují dokončené DPIA před tím, než jakýkoli systém AI zpracovává osobní data. To je přísnější než obecný test GDPR. DPIA musí pokrývat:
- Datové toky — tréninková data, vstupy a výstupy
- Právní základ — zdokumentovaný pro každou činnost
- Jazyková přesnost — požadována pro jazyky pod průměrem EU
- Lidský přezkum — způsob kontroly automatizovaných rozhodnutí
DPIA musí být aktualizováno každý rok při přetrénování systému.
Pro týmy nasazující nástroje AI na maďarská data je pořadí pevně dáno: nejprve DPIA, pak nasazení.
Minimální technické kontroly
Tři kontroly tvoří základ pro soulad s NAIH:
- Detekce TAJ-szám s kontrolním součtem modulo-10 — samotná shoda vzoru nestačí
- Detekce adóazonosító jel s validací kontrolního součtu — klíčové pro HR a finance
- Maďarský NER s podporou aglutinace — musí zvládat ő, ű a varianty kódování
Viz náš průvodce BFDI Německo pro srovnání toho, jak středoevropské DPA stanovují technické požadavky. Pro podobnou jazykovou mezeru ve střední Evropě viz náš průvodce ÚOOÚ Czech.