NAIH Hungaria: TAJ-Szám dan Persyaratan Teknis GDPR
Diperbarui untuk 2026
Otoritas data Hungaria adalah NAIH. Laporan tahun 2024 menemukan bahwa akurasi NER untuk bahasa Hungaria hanya 67%, sementara rata-rata UE adalah 82%. Kesenjangan ini menciptakan risiko nyata karena alat yang dibangun untuk bahasa Inggris atau Jerman melewatkan pengenal Hungaria pada tingkat yang tinggi.
Mengapa Skor NER Bahasa Hungaria Rendah
Tiga fitur bahasa Hungaria merusak model NLP standar.
Aglutinasi: Bahasa Hungaria menambahkan sufiks pada kata dasar. Nama yang sama memiliki banyak bentuk dalam satu kalimat. "Kovács Péter" dalam posisi subjek menjadi "Kovács Péternek" dalam peran lain. Model NER harus menghubungkan semua bentuk tersebut ke satu orang.
Urutan nama: Bahasa Hungaria menempatkan nama keluarga di depan. Kebanyakan model NLP mengharapkan nama depan terlebih dahulu. Pembalikan ini menyebabkan deteksi yang terlewat.
Karakter khusus: Bahasa Hungaria menggunakan ő dan ű yang berbeda dari umlaut Jerman. Pengkodean campuran — Windows-1250 vs UTF-8 — juga menyebabkan kegagalan.
Tiga faktor ini menjelaskan sebagian besar kesenjangan akurasi dalam laporan NAIH 2024.
TAJ-Szám: Nomor Jaminan Sosial Hungaria
TAJ-szám (Társadalombiztosítási Azonosító Jel) adalah nomor 9 digit yang muncul dalam catatan layanan kesehatan, penggajian, tunjangan sosial, dan pensiun.
Checksum: Kalikan digit 1 hingga 8 dengan bobot 3, 7, 3, 7, 3, 7, 3, 7. Jumlahkan hasilnya. Ambil modulo 10 untuk mendapatkan digit pemeriksaan.
Algoritma ini unik untuk Hungaria dan berbeda dari algoritma Luhn yang digunakan di negara-negara lain.
Alat generik mendeteksi TAJ-szám hanya dengan akurasi 61%, menurut laporan NAIH 2024. Format 9 digit menyerupai banyak nomor lain dalam dokumen Hungaria. Tanpa langkah checksum, alat menghasilkan positif palsu dan melewatkan yang asli.
Adóazonosító Jel: ID Pajak Hungaria
Adóazonosító jel adalah nomor pajak pribadi 10 digit dengan digit pertama selalu 8. Nomor ini muncul dalam catatan ketenagakerjaan, pengajuan pajak, dan dokumen keuangan.
Checksum: Ambil digit 2 hingga 9. Kalikan dengan bobot 9, 7, 3, 1, 9, 7, 3, 1. Jumlahkan hasilnya. Ambil modulo 10 untuk mendapatkan digit pemeriksaan. Hasil 0 berarti digit pemeriksaan adalah 0.
Kasus penegakan NAIH menunjukkan nomor ini sering terlewat dalam dokumen HR ketika alat dikonfigurasi untuk bahasa lain.
Lihat panduan ID pajak nasional UE kami untuk melihat bagaimana nomor-nomor ini dibandingkan di seluruh negara anggota.
Persyaratan DPIA NAIH untuk Sistem AI
Panduan NAIH tahun 2024 mewajibkan DPIA yang telah selesai sebelum sistem AI apapun memproses data pribadi. Ini lebih ketat dari uji GDPR umum. DPIA harus mencakup:
- Aliran data — data pelatihan, input, dan output
- Dasar hukum — didokumentasikan untuk setiap aktivitas
- Akurasi bahasa — diperlukan untuk bahasa di bawah rata-rata UE
- Tinjauan manusia — cara untuk memeriksa keputusan otomatis
DPIA harus diperbarui setiap tahun ketika sistem dilatih ulang.
Untuk tim yang menerapkan alat AI pada data Hungaria, urutannya sudah pasti: DPIA terlebih dahulu, baru kemudian penerapan.
Kontrol Teknis Minimum
Tiga kontrol membentuk dasar kepatuhan NAIH:
- Deteksi TAJ-szám dengan checksum modulo-10 — pencocokan pola saja tidak cukup
- Deteksi adóazonosító jel dengan validasi checksum — kritis untuk HR dan keuangan
- NER bahasa Hungaria dengan dukungan aglutinasi — harus menangani ő, ű, dan varian pengkodean
Lihat panduan BFDI Jerman kami untuk membandingkan bagaimana DPA Eropa Tengah menetapkan persyaratan teknis. Untuk kesenjangan bahasa serupa di Eropa Tengah, lihat panduan ÚOOÚ Ceko kami.