NAIH Hungría: TAJ-Szám y requisitos técnicos del RGPD
Actualizado para 2026
La autoridad de protección de datos de Hungría es la NAIH. Su informe de 2024 muestra que la precisión NER para el húngaro es solo del 67 %. La media europea es del 82 %. Esa diferencia genera riesgo real. Las herramientas diseñadas para inglés o alemán suelen pasar por alto los identificadores húngaros.
Por qué el NER en húngaro obtiene peores resultados
Tres características del húngaro dificultan los modelos NLP estándar.
Aglutinación: El húngaro forma palabras añadiendo sufijos a las raíces. El mismo nombre adopta muchas formas en una frase. «Kovács Péter» como sujeto se convierte en «Kovács Péternek» en dativo. Los modelos NER deben vincular todas esas formas a una sola persona.
Orden de los nombres: En húngaro, el apellido va primero. La mayoría de los modelos NLP esperan el nombre de pila primero. Esa inversión provoca detecciones fallidas.
Caracteres especiales: El húngaro usa ő y ű. Estas letras son distintas de las umlauts alemanas. La mezcla de codificaciones — Windows-1250 frente a UTF-8 — también genera errores.
Estos tres factores explican la mayor parte de la brecha de precisión del informe NAIH 2024.
TAJ-Szám: el número de seguridad social húngaro
El TAJ-szám (Társadalombiztosítási Azonosító Jel) es un número de 9 dígitos. Aparece en historias clínicas, nóminas, prestaciones sociales y cuentas de pensión.
Dígito de control: Multiplica los dígitos del 1 al 8 por los pesos 3, 7, 3, 7, 3, 7, 3, 7. Suma los resultados. Calcula el módulo 10. El resultado es el dígito de control.
Este algoritmo es específico de Hungría. Difiere del algoritmo de Luhn utilizado en otros países.
Según el informe NAIH 2024, las herramientas genéricas detectan el TAJ-szám con solo un 61 % de precisión. El formato de 9 dígitos se parece a muchos otros números en documentos húngaros. Sin el paso de verificación, se producen demasiados falsos positivos.
Adóazonosító Jel: el número fiscal húngaro
El adóazonosító jel es un número de identificación fiscal personal de 10 dígitos. El primer dígito siempre es 8. Aparece en contratos laborales, declaraciones fiscales y documentos financieros.
Dígito de control: Toma los dígitos del 2 al 9. Multiplica por los pesos 9, 7, 3, 1, 9, 7, 3, 1. Suma. Calcula el módulo 10. Ese es el dígito de control. Un resultado de 0 significa que el dígito de control es 0.
Los casos de aplicación de la NAIH muestran que este número se pasa por alto con frecuencia en documentos de RRHH procesados por herramientas configuradas para otros idiomas.
Consulta nuestra guía de identificadores fiscales nacionales de la UE para comparar estos números en los estados miembros.
El requisito de EIPD de la NAIH para sistemas de IA
La guía NAIH 2024 exige una EIPD completa antes de desplegar cualquier sistema de IA que procese datos personales. Esto es más estricto que la prueba general del RGPD. La EIPD debe cubrir:
- Flujos de datos — datos de entrenamiento, entradas y salidas
- Base jurídica — documentada para cada actividad
- Precisión lingüística — obligatoria para idiomas por debajo de la media europea
- Revisión humana — un mecanismo para verificar decisiones automatizadas
La EIPD debe actualizarse cada año cuando el sistema se vuelva a entrenar.
Para equipos que despliegan herramientas de IA sobre datos húngaros, el orden es fijo: primero la EIPD, luego el despliegue.
Controles técnicos mínimos
Tres controles forman la base del cumplimiento con la NAIH:
- Detección del TAJ-szám con suma de verificación módulo 10 — el reconocimiento de patrones solo no basta
- Detección del adóazonosító jel con validación — crítico para RRHH y finanzas
- NER húngaro con soporte de aglutinación — debe manejar ő, ű y variantes de codificación
Nuestra guía BFDI Alemania compara cómo las APD de Europa Central establecen requisitos técnicos. Para una brecha lingüística similar, consulta nuestra guía checa ÚOOÚ.