NAIH Unkari: TAJ-szám ja GDPR:n tekniset vaatimukset
Päivitetty vuodelle 2026
Unkarin tietosuojaviranomainen on NAIH. Sen vuoden 2024 raportti osoitti, että kohdetunnistuksen tarkkuus unkarille on vain 67 %. EU:n keskiarvo on 82 %. Tämä aukko luo todellisen riskin. Englantia tai saksaa varten rakennetut työkalut jäävät unkarilaisista tunnisteista kiinni korkealla osuudella.
Miksi Unkarilainen Kohdetunnistus Saa Alhaisia Pisteitä
Kolme unkarin kielen piirrettä rikkoo standardit NLP-mallit.
Agglutinaatio: Unkari lisää suffikseja juurisanoihin. Sama nimi saa monta muotoa lauseessa. "Kovács Péter" subjektipaikalla muuttuu muodoksi "Kovács Péternek" toisessa roolissa. Kohdetunnistusmallien on linkitettävä kaikki nämä muodot yhteen henkilöön.
Nimienjärjestys: Unkari asettaa sukunimen ensin. Useimmat NLP-mallit odottavat etunimen ensin. Tämä käänteinen järjestys aiheuttaa tunnistamatta jääneitä kohteita.
Erikoismerkit: Unkari käyttää merkkejä ő ja ű. Nämä eivät ole sama kuin saksalaiset umlauttit. Sekakoodeaus — Windows-1250 vs UTF-8 — aiheuttaa myös epäonnistumisia.
Nämä kolme tekijää selittävät suurimman osan NAIH:n vuoden 2024 raportin tarkkuusaukosta.
TAJ-szám: Unkarin Sosiaaliturvatunnus
TAJ-szám (Társadalombiztosítási Azonosító Jel) on 9-numeroinen numero. Se esiintyy terveydenhuollossa, palkanlaskennassa, sosiaalietuuksissa ja eläketietueissa.
Tarkistussumma: Kerrotaan numerot 1–8 painoilla 3, 7, 3, 7, 3, 7, 3, 7. Lasketaan tulot yhteen. Otetaan modulo 10. Tämä antaa tarkistusnumeron.
Tämä algoritmi on Unkarille ainutlaatuinen. Se ei ole sama kuin Luhn-algoritmi, jota käytetään muissa maissa.
Yleiset työkalut tunnistavat TAJ-számn vain 61 %:n tarkkuudella NAIH:n vuoden 2024 raportin mukaan. 9-numeroinen muoto näyttää monilta muilta numeroilta unkarilaisissa asiakirjoissa. Ilman tarkistussumman vaihetta työkalut merkitsevät vääriä positiivisia ja jäävät oikeista kiinni.
Adóazonosító jel: Unkarin Verotunnus
Adóazonosító jel on 10-numeroinen henkilökohtainen veronumero. Ensimmäinen numero on aina 8. Se esiintyy työsuhdetiedoissa, veroilmoituksissa ja talousasiakirjoissa.
Tarkistussumma: Otetaan numerot 2–9. Kerrotaan painoilla 9, 7, 3, 1, 9, 7, 3, 1. Lasketaan tulot yhteen. Otetaan modulo 10. Tämä on tarkistusnumero. Nollatulos tarkoittaa, että tarkistusnumero on 0.
NAIH:n täytäntöönpanotapaukset osoittavat, että tämä numero jää usein huomaamatta HR-asiakirjoista, kun työkalut on konfiguroitu muille kielille.
Katso EU:n kansallisten verotunnusten opas siitä, miten nämä numerot vertautuvat jäsenvaltioiden välillä.
NAIH:n DPIA-Vaatimus Tekoälyjärjestelmille
NAIH:n vuoden 2024 ohjeistus edellyttää valmistunutta DPIA:ta ennen kuin mikään tekoälyjärjestelmä käsittelee henkilötietoja. Tämä on tiukempaa kuin yleinen GDPR-testi. DPIA:n on katettava:
- Tietovirrat — koulutusdata, syötteet ja tuotokset
- Oikeudellinen perusta — dokumentoitu jokaiselle toiminnalle
- Kielitarkkuus — vaadittu kielille, jotka jäävät alle EU:n keskiarvon
- Ihmisen tarkistus — tapa tarkistaa automatisoidut päätökset
DPIA on päivitettävä joka vuosi, kun järjestelmä koulutetaan uudelleen.
Tekoälytyökaluja unkarilaiselle datalle ottaville tiimeille järjestys on kiinteä: DPIA ensin, sitten käyttöönotto.
Vähimmäistekniset Hallintakeinot
Kolme hallintakeinoa muodostavat NAIH-vaatimustenmukaisuuden lähtötason:
- TAJ-számn tunnistus modulo-10-tarkistussummalla — kuviohaku yksinään ei riitä
- Adóazonosító jelin tunnistus tarkistussumman validoinnilla — kriittinen HR:lle ja rahoitukselle
- Unkarilainen kohdetunnistus agglutinaatiotuella — on käsiteltävä ő, ű ja koodausvariantit
Katso BfDI Saksa -opas vertaillaksesi miten Keski-Euroopan tietosuojaviranomaiset asettavat tekniset vaatimukset. Samanlaisesta kieliaukosta Keski-Euroopassa katso tšekin ÚOOÚ-opas.