NAIH Ungverjaland: TAJ-Szám og GDPR-tæknilegar Kröfur
Uppfært fyrir 2026
Gagnaverndarstofnun Ungverjalands er NAIH. Skýrsla hennar 2024 leiddi í ljós að NER-nákvæmni fyrir ungversku er aðeins 67%. ESB-meðaltalið er 82%. Þetta bil skapar raunverulega áhættu. Verkfæri byggð fyrir ensku eða þýsku missa ungverskur auðkenni á miklum hlutfallum.
Af hverju ungversk NER-stig eru lág
Þrír eiginleikar ungversku brjóta hefðbundin NLP-líkön.
Agglúterasjon: Ungverska bætir viðskeytum við rótarorð. Sama nafnið tekur margar myndir í setningu. "Kovács Péter" í frumstigi verður "Kovács Péternek" í öðrum hlutverki. NER-líkön verða að tengja allar þær myndir við einn einstakling.
Nafnaröð: Ungverska setur fjölskylduheitið fyrst. Flest NLP-líkön búast við eiginnafni fyrst. Þessi snúningur veldur missum uppgötvunum.
Sérstafir: Ungverska notar ő og ű. Þessir eru ekki þeir sömu og þýsk umlaut. Blandaðar kóðanir — Windows-1250 á móti UTF-8 — valda einnig bilunum.
Þessir þrír þættir skýra flestar nákvæmnibilin í skýrslu NAIH 2024.
TAJ-Szám: Félagslegt tryggingarnúmer Ungverjalands
TAJ-szám (Társadalombiztosítási Azonosító Jel) er 9 stafa númer. Það kemur fram í heilbrigðis-, launagreiðslu-, félagslegum bótum og lífeyrisskrám.
Eftirlitssumma: Margfaldaðu stafi 1 til 8 með þyngdum 3, 7, 3, 7, 3, 7, 3, 7. Leggðu saman niðurstöðurnar. Taktu leif eftir 10. Það gefur athugunartöluna.
Þessi reiknirit er einstakt fyrir Ungverjaland. Það er ekki það sama og Luhn-reiknirit sem notað er í öðrum löndum.
Almenn verkfæri greina TAJ-szám með aðeins 61% nákvæmni, samkvæmt NAIH-skýrslu 2024. 9 stafa sniðið líkist mörgum öðrum númerum í ungverskum skjölum. Án eftirlitssummuþrefsins merkja verkfæri fölsk jákvæð og missa raunveruleg.
Adóazonosító Jel: Skattauðkenni Ungverjalands
Adóazonosító jel er 10 stafa persónulegt skattanúmer. Fyrsti stafurinn er alltaf 8. Það kemur fram í ráðningarskrám, skattskýrslum og fjárhagslegum skjölum.
Eftirlitssumma: Taktu stafi 2 til 9. Margfaldaðu með þyngdum 9, 7, 3, 1, 9, 7, 3, 1. Leggðu saman niðurstöðurnar. Taktu leif eftir 10. Það er athugunartalan. Niðurstaða 0 þýðir að athugunartalan er 0.
Framfylgdarmál NAIH sýna að þetta númer er oft misst í mannauðsskjölum þegar verkfæri eru stillt upp fyrir önnur tungumál.
Sjá ESB-þjóðlegt skattauðkennisleiðbeiningar okkar til að sjá hvernig þessi númer bera saman yfir aðildarríki.
DPIA-krafa NAIH fyrir gervigreindakerfi
Leiðbeiningar NAIH 2024 krefjast fullkláraðrar DPIA áður en gervigreindakerfi vinnur úr persónulegum gögnum. Þetta er strangara en almenna GDPR-prófið. DPIA verður að ná yfir:
- Gagnaflæði — þjálfunargögn, inntök og framleiðsla
- Lagaleg grundvöllur — skráð fyrir sérhverja starfsemi
- Tungumála-nákvæmni — krafist fyrir tungumál undir ESB-meðaltali
- Mannleg endurskoðun — leið til að athuga sjálfvirkar ákvarðanir
DPIA verður að vera uppfærð á hverju ári þegar kerfið er endurþjálfað.
Fyrir teymi sem setja upp gervigreindaverkfæri á ungverskum gögnum er röðin föst: DPIA fyrst, þá innleiðing.
Lágmarksráðstafanir
Þrjár ráðstafanir mynda grunnlínu fyrir NAIH-samræmi:
- TAJ-szám-uppgötvun með modulo-10 eftirlitssummu — myndauppgötvun ein og sér er ekki nóg
- Adóazonosító jel-uppgötvun með eftirlitssummustaðfestingu — mikilvægt fyrir mannauðs- og fjármálaþjónustu
- Ungversk NER með agglúterasjonsstuðningi — verður að meðhöndla ő, ű og kóðunarsafbrigði
Sjá leiðbeiningar okkar um BFDI Þýskaland til að bera saman hvernig Mið-Evrópuskar DPA-stofnanir setja tæknilegar kröfur. Til að sjá svipaðan tungumálabil í Mið-Evrópu, sjá leiðbeiningar okkar um tékkneskt ÚOOÚ.