NAIH Hungary: TAJ-Szám dan Keperluan Teknikal GDPR
Dikemas kini untuk 2026
Pihak berkuasa data Hungary ialah NAIH. Laporan 2024-nya mendapati bahawa ketepatan NER untuk bahasa Hungary hanya 67%. Purata EU ialah 82%. Jurang itu menimbulkan risiko nyata. Alat yang dibina untuk bahasa Inggeris atau Jerman terlepas pengenal Hungary pada kadar tinggi.
Mengapa NER Hungary Mendapat Markah Rendah
Tiga ciri bahasa Hungary memecahkan model NLP standard.
Aglutinasi: Bahasa Hungary menambah akhiran kepada kata akar. Nama yang sama mengambil banyak bentuk dalam ayat. "Kovács Péter" dalam kedudukan subjek menjadi "Kovács Péternek" dalam peranan lain. Model NER mesti menghubungkan semua bentuk tersebut kepada satu orang.
Susunan nama: Hungary meletakkan nama keluarga dahulu. Kebanyakan model NLP mengharapkan nama pertama dahulu. Penyongsangan itu menyebabkan pengesanan terlepas.
Aksara khas: Hungary menggunakan ő dan ű. Ini bukan sama dengan umlaut Jerman. Pengekodan bercampur — Windows-1250 berbanding UTF-8 — juga menyebabkan kegagalan.
Tiga faktor ini menjelaskan sebahagian besar jurang ketepatan dalam laporan NAIH 2024.
TAJ-Szám: Nombor Jaminan Sosial Hungary
TAJ-szám (Társadalombiztosítási Azonosító Jel) ialah nombor 9 digit. Ia muncul dalam rekod penjagaan kesihatan, senarai gaji, faedah sosial, dan pencen.
Checksum: Darabkan digit 1 hingga 8 dengan pemberat 3, 7, 3, 7, 3, 7, 3, 7. Tambah hasilnya. Ambil modulo 10. Itu memberikan digit semak.
Algoritma ini unik kepada Hungary. Ia bukan algoritma Luhn yang digunakan di negara lain.
Alat generik mengesan TAJ-szám hanya pada ketepatan 61%, mengikut laporan NAIH 2024. Format 9 digit kelihatan seperti banyak nombor lain dalam dokumen Hungary. Tanpa langkah checksum, alat menandai positif palsu dan terlepas yang sebenar.
Adóazonosító Jel: ID Cukai Hungary
Adóazonosító jel ialah nombor cukai peribadi 10 digit. Digit pertama sentiasa 8. Ia muncul dalam rekod pekerjaan, pemfailan cukai, dan dokumen kewangan.
Checksum: Ambil digit 2 hingga 9. Darabkan dengan pemberat 9, 7, 3, 1, 9, 7, 3, 1. Tambah hasilnya. Ambil modulo 10. Itulah digit semak. Keputusan 0 bermakna digit semak ialah 0.
Kes penguatkuasaan NAIH menunjukkan nombor ini sering terlepas dalam dokumen HR apabila alat ditetapkan untuk bahasa lain.
Lihat panduan ID cukai nasional EU kami untuk cara nombor ini dibandingkan merentasi negara anggota.
Keperluan DPIA NAIH untuk Sistem AI
Panduan 2024 NAIH memerlukan DPIA yang lengkap sebelum mana-mana sistem AI memproses data peribadi. Ini lebih ketat daripada ujian GDPR am. DPIA mesti merangkumi:
- Aliran data — data latihan, input, dan output
- Asas undang-undang — didokumentasikan untuk setiap aktiviti
- Ketepatan bahasa — diperlukan untuk bahasa di bawah purata EU
- Semakan manusia — cara untuk menyemak keputusan automatik
DPIA mesti dikemas kini setiap tahun apabila sistem dilatih semula.
Bagi pasukan yang menggunakan alat AI pada data Hungary, susunannya tetap: DPIA dahulu, kemudian penggunaan.
Kawalan Teknikal Minimum
Tiga kawalan membentuk garis asas untuk pematuhan NAIH:
- Pengesanan TAJ-szám dengan checksum modulo-10 — padanan corak sahaja tidak mencukupi
- Pengesanan adóazonosító jel dengan pengesahan checksum — kritikal untuk HR dan kewangan
- NER Hungary dengan sokongan aglutinasi — mesti mengendalikan ő, ű, dan varian pengekodan
Lihat panduan BFDI Jerman kami untuk membandingkan cara DPA Eropah Tengah menetapkan keperluan teknikal. Untuk jurang bahasa yang serupa di Eropah Tengah, lihat panduan ÚOOÚ Czech kami.