NAIH Madjarska: TAJ-szam i GDPR tehnicki zahtjevi
Azurirano za 2026.
Madjarsko tijelo za zastitu podataka je NAIH. Njegovo izvjesce za 2024. utvrdilo je da je tocnost NER-a za madjarsk samo 67%. EU prosjek je 82%. Taj jaz stvara stvarni rizik. Alati izgradeni za engleski ili njemacki propustaju madjaske identifikatore po visokim stopama.
Zasto NER za madjarsk ima nize ocjene
Tri znacajke madjarski razaraju standardne NLP modele.
Aglutinacija: Madjarsk dodaje sufikse korijenskim rijecima. Isto ime uzima mnoge oblike u recenici. "Kovacs Peter" u subjektnoj poziciji postaje "Kovacs Peternek" u drugoj ulozi. NER modeli moraju povezati sve te oblike s jednom osobom.
Redoslijed imena: Madjarsk stavlja prezime na prvo mjesto. Vecina NLP modela ocekuje ime prvo. Taj obrnuti redoslijed uzrokuje propustena otkrivanja.
Posebni znakovi: Madjarsk koristi o dvostruko dugo i u dvostruko dugo. To nisu isti znakovi kao njemacki umlaut. Mjesovito kodiranje -- Windows-1250 nasuprot UTF-8 -- takoder uzrokuje pogresaka.
Ova tri faktora objasnjuju vecinu jaza u tocnosti u NAIH-ovom izvjescu za 2024.
TAJ-szam: Madjarsk broj socijalnog osiguranja
TAJ-szam (Tarsadalombiztositasi Azonosito Jel) je 9-znamenkasti broj. Pojavljuje se u zdravstvenim evidencijama, obracunu placa, socijalnim beneficijama i mirovinskim evidencijama.
Kontrolna suma: Pomnozite znamenke 1 do 8 tezinskim faktorima 3, 7, 3, 7, 3, 7, 3, 7. Zbrojite rezultate. Uzmite modulo 10. To daje kontrolnu znamenku.
Ovaj algoritam jedinstven je za Madjarsku. Nije isti kao Luhnov algoritam koji se koristi u drugim zemljama.
Genericni alati otkrivaju TAJ-szam s tocnoscu od samo 61%, prema NAIH izvjescu za 2024. Format od 9 znamenki nalikuje na mnoge druge brojeve u madjarskim dokumentima. Bez koraka kontrolne sume, alati oznacavaju lazno pozitivne i propustaju prave.
Adoazonosito jel: Madjarski porezni identifikator
Adoazonosito jel je 10-znamenkasti osobni porezni broj. Prva znamenka je uvijek 8. Pojavljuje se u evidencijama zaposljavanja, poreznim prijavama i financijskim dokumentima.
Kontrolna suma: Uzmite znamenke 2 do 9. Pomnozite tezinskim faktorima 9, 7, 3, 1, 9, 7, 3, 1. Zbrojite rezultate. Uzmite modulo 10. To je kontrolna znamenka. Rezultat 0 znaci da je kontrolna znamenka 0.
Slucajevi provedbe NAIH-a pokazuju da se ovaj broj cesto propusta u HR dokumentima kad su alati konfigurirani za druge jezike.
Pogledajte nas vodic za EU nacionalne porezne identifikatore o tome kako se ovi brojevi usporeduju u drzavama clanicama.
NAIH-ov zahtjev za DPIA AI sustava
Smernice NAIH-a za 2024. zahtijevaju dovrsenu DPIA prije nego sto bilo koji AI sustav obraduje osobne podatke. To je strozije od opceg GDPR testa. DPIA mora pokrivati:
- Tokovi podataka -- podaci za obucavanje, ulazi i izlazi
- Pravna osnova -- dokumentirana za svaku aktivnost
- Jezicna tocnost -- obvezna za jezike ispod EU prosjeka
- Ljudski pregled -- nacin provjere automatiziranih odluka
DPIA se mora azurirati svake godine kad se sustav ponovo obucava.
Za timove koji implementiraju AI alate na madjarskim podacima, redoslijed je fiksan: prvo DPIA, zatim implementacija.
Minimalne tehnicke kontrole
Tri kontrole cine osnovu za uskladjenost s NAIH-om:
- Otkrivanje TAJ-szama s modulo-10 kontrolnom sumom -- podudaranje uzorka samo po sebi nije dovoljno
- Otkrivanje adoazonosito jela s validacijom kontrolne sume -- kriticno za HR i financije
- NER za madjarsk s podrscom aglutinacije -- mora rukovati posebnim znakovima i varijantama kodiranja
Pogledajte nas vodic BFDI Njemacka da usporedite kako centralno-europski DPA-ovi postavljaju tehnicke zahtjeve. Za slicnu jezicnu prazninu u Centralnoj Europi, pogledajte nas cesk vodic UOOU.