NAIH Macaristan: TAJ-Szám ve GDPR Teknik Gereksinimleri
2026 için güncellenmiştir
Macaristan'ın veri otoritesi NAIH'tir. 2024 raporu, Macarca NER doğruluğunun yalnızca %67 olduğunu buldu. AB ortalaması %82'dir. Bu boşluk gerçek risk yaratıyor. İngilizce veya Almanca için oluşturulan araçlar, Macar tanımlayıcılarını yüksek oranlarda kaçırıyor.
Macaristan NER Puanının Düşük Olmasının Nedeni
Macarcenin üç özelliği standart NLP modellerini zorluyor.
Eklemleme: Macarca kök sözcüklere son ekler ekliyor. Aynı isim bir cümlede birçok biçim alıyor. Özne konumunda "Kovács Péter", başka bir rolde "Kovács Péternek" oluyor. NER modellerinin tüm bu biçimleri tek bir kişiye bağlaması gerekiyor.
İsim sırası: Macarca aile adını önce koyuyor. Çoğu NLP modeli, verilen adın önce gelmesini bekliyor. Bu tersine çevirme kaçırılan tespitlere yol açıyor.
Özel karakterler: Macarca ő ve ű kullanıyor. Bunlar Almanca umlautlarıyla aynı değil. Karma kodlama — Windows-1250'ye karşı UTF-8 — da başarısızlıklara neden oluyor.
Bu üç faktör, NAIH'ın 2024 raporundaki doğruluk boşluğunun büyük bölümünü açıklıyor.
TAJ-Szám: Macaristan'ın Sosyal Güvenlik Numarası
TAJ-szám (Társadalombiztosítási Azonosító Jel), 9 haneli bir numaradır. Sağlık, bordro, sosyal yardımlar ve emeklilik kayıtlarında görünür.
Sağlama toplamı: 1 ile 8 arasındaki rakamları ağırlıklarla çarpın (3, 7, 3, 7, 3, 7, 3, 7). Sonuçları toplayın. 10'a göre modunu alın. Bu kontrol rakamını verir.
Bu algoritma Macaristan'a özgüdür. Diğer ülkelerde kullanılan Luhn algoritmasıyla aynı değil.
Genel araçlar, NAIH 2024 raporuna göre TAJ-szám'ı yalnızca %61 doğrulukla tespit ediyor. 9 haneli biçim, Macar belgelerindeki pek çok başka sayı gibi görünüyor. Sağlama toplamı adımı olmadan araçlar yanlış pozitifler işaretler ve gerçeklerini kaçırır.
Adóazonosító Jel: Macaristan'ın Vergi Kimliği
Adóazonosító jel, 10 haneli kişisel vergi numarasıdır. İlk rakam her zaman 8'dir. İstihdam kayıtlarında, vergi beyanlarında ve finansal belgelerde görünür.
Sağlama toplamı: 2 ile 9 arasındaki rakamları alın. Ağırlıklarla çarpın (9, 7, 3, 1, 9, 7, 3, 1). Sonuçları toplayın. 10'a göre modunu alın. Bu kontrol rakamıdır. 0 sonucu, kontrol rakamının 0 olduğu anlamına gelir.
NAIH uygulama davaları, araçlar diğer diller için yapılandırıldığında bu numaranın İK belgelerinde sıklıkla kaçırıldığını gösteriyor.
Bu numaraların üye devletler genelinde nasıl karşılaştırıldığı için AB ulusal vergi kimliği rehberimize bakın.
NAIH'ın Yapay Zeka Sistemleri İçin DPIA Zorunluluğu
NAIH'ın 2024 rehberi, herhangi bir yapay zeka sistemi kişisel veri işlemeden önce tamamlanmış bir DPIA gerektiriyor. Bu, genel GDPR testinden daha katıdır. DPIA şunları kapsamalı:
- Veri akışları — eğitim verisi, girdiler ve çıktılar
- Hukuki dayanak — her faaliyet için belgelenmiş
- Dil doğruluğu — AB ortalamasının altındaki diller için zorunlu
- İnsan incelemesi — otomatik kararları kontrol etmenin bir yolu
Sistem yeniden eğitildiğinde DPIA her yıl güncellenmeli.
Macar verileri üzerinde yapay zeka araçları dağıtan ekipler için sıra belirlenmiş: önce DPIA, sonra dağıtım.
Minimum Teknik Kontroller
Üç kontrol, NAIH uyumluluğunun temelini oluşturuyor:
- Modulo-10 sağlama toplamlı TAJ-szám tespiti — salt desen eşleştirme yeterli değil
- Sağlama toplamı doğrulamalı adóazonosító jel tespiti — İK ve finans için kritik
- Eklemleme destekli Macarca NER — ő, ű ve kodlama varyantlarını işleyebilmeli
Orta Avrupa Veri Koruma Otoritelerinin teknik gereksinimleri nasıl belirlediğini karşılaştırmak için BFDI Almanya rehberimize bakın. Orta Avrupa'daki benzer bir dil boşluğu için Çek ÚOOÚ rehberimize bakın.