Volver al BlogGDPR y Cumplimiento

HDPA Grecia: Detección de AFM y AMKA — Por qué los identificadores griegos fallan en el 52% de las herramientas NLP genéricas

AFM griego detectado con un 52% de precisión por herramientas genéricas. HDPA emitió 89 decisiones en 2024 — un aumento del 162% respecto a 2022. Los sectores de turismo y marítimo enfrentan requisitos de cumplimiento distintos. Requisitos de NER del alfabeto griego.

March 7, 20267 min de lectura
Greece HDPAAFM AMKA detectionGreek alphabet NERtourism GDPRGreek identifiers

La Autoridad Helénica de Protección de Datos (HDPA) de Grecia emitió 89 decisiones de aplicación en 2024, un aumento del 162% respecto a las 34 decisiones en 2022. La aceleración drástica en la aplicación refleja tanto la creciente capacidad de la HDPA como los fracasos de cumplimiento específicos de cada sector en el turismo — que representa el 38% de los casos de la HDPA — y las operaciones marítimas.

AFM: El Identificador Comercial Primario de Grecia

El ΑΦΜ (Αριθμός Φορολογικού Μητρώου, Número de Registro Fiscal) es un número de 9 dígitos asignado a todos los ciudadanos, residentes y empresas griegas para la administración fiscal. El dígito de control utiliza un algoritmo de suma ponderada: multiplica los dígitos 1-8 por pesos (256,128,64,32,16,8,4,2), suma, toma el módulo 11. Si el resultado = 10, el número es inválido. De lo contrario, el dígito de control = resultado módulo 10.

El AFM aparece en todos los documentos comerciales griegos — facturas, contratos, acuerdos laborales y formularios gubernamentales. Es el identificador comercial primario tanto para individuos como para empresas en Grecia.

Precisión de detección: Las herramientas NLP genéricas detectan el AFM con un 52% de precisión (análisis de la HDPA 2024). Los modos de fallo:

  • El formato de 9 dígitos del AFM coincide con muchos números de referencia y componentes de fecha en documentos griegos
  • El dígito de control de dos pasos de módulo-11/módulo-10 no se implementa comúnmente en herramientas genéricas
  • Los documentos griegos presentan frecuentemente el AFM sin una etiqueta explícita en el contexto (embebido en bloques de dirección, no etiquetado como "ΑΦΜ:")

AMKA: El Identificador de Seguro Social de Grecia

El ΑΜΚΑ (Αριθμός Μητρώου Κοινωνικής Ασφάλισης, Número de Registro de Seguro Social) es un número de 11 dígitos que codifica la fecha de nacimiento y el género:

  • Dígitos 1-6: Fecha de nacimiento en formato DDMMYY
  • Dígito 7: Género (impar = masculino, par = femenino)
  • Dígitos 8-11: Número secuencial con dígito de control

La codificación de la fecha de nacimiento + género hace que el AMKA sea estructuralmente similar al personnummer de Suecia — y crea la misma preocupación de categoría especial del GDPR: el número revela el sexo biológico como un asunto de registro.

El AMKA aparece en todos los documentos de atención médica griega, declaraciones de seguridad social y registros de empleadores. Cada ciudadano griego y residente legal tiene un AMKA, lo que lo convierte en el equivalente de un número de seguro social para el acceso a atención médica y beneficios sociales.

Alfabeto Griego: El Desafío de Infraestructura de NLP

El texto griego utiliza el alfabeto griego — un sistema de escritura completamente diferente de los idiomas de escritura latina. Esto crea un desafío fundamental de infraestructura para la detección de PII:

Rangos de Unicode: Los caracteres griegos ocupan el rango de Unicode U+0370 a U+03FF (bloque griego y copto) y U+1F00 a U+1FFF (griego extendido para formas polifónicas). Las herramientas que solo manejan caracteres ASCII o extendidos en latín no pueden procesar texto griego en absoluto.

Modelos de NER griegos: El modelo el_core_news de spaCy proporciona capacidad de NER en griego — pero requiere configuración explícita del idioma griego. Las organizaciones que utilizan configuraciones de idioma predeterminadas (típicamente inglés) no recibirán salida para documentos en escritura griega.

Documentos de escritura mixta: Los documentos comerciales y gubernamentales griegos mezclan frecuentemente la escritura griega (contenido principal) con la escritura latina (nombres de marcas, términos técnicos, anotaciones en inglés). Las canalizaciones de NLP deben manejar ambos guiones en el mismo documento.

Reconocimiento de nombres en griego: Los nombres griegos aparecen en caso nominativo (Γεώργιος Παπαδόπουλος) pero también en formas genitiva/acusativa en oraciones griegas (Γεωργίου Παπαδόπουλου en genitivo). El reconocimiento de NER consciente del caso requiere análisis morfológico griego.

Sector Turístico: Cumplimiento de Procesamiento de Datos Estacionales

El turismo representa el 38% de los casos de aplicación de la HDPA. El desafío de cumplimiento es la escala y la estacionalidad:

Sistemas PMS de hoteles: Los sistemas de gestión de propiedades procesan información completa de los huéspedes — números de pasaporte, nacionalidad, fechas de nacimiento, datos de contacto — para todos los huéspedes. La aplicación de la HDPA encontró que muchos sistemas PMS de hoteles retienen datos de huéspedes durante más de 5 años sin un propósito documentado y sin medidas de seguridad proporcionales al volumen de datos.

Datos de IBAN y pago: Las empresas turísticas griegas procesan datos de pago de huéspedes de la UE e internacionales. Los folios de huéspedes (facturas de hotel) contienen números de tarjeta parciales; los sistemas de reservas contienen detalles completos de pago con fechas de caducidad. El cumplimiento de PCI DSS se superpone con los requisitos del GDPR para datos de pago.

Rotación de datos del personal: Los trabajadores estacionales en la hospitalidad suelen completar contratos de 4-6 meses. La aplicación de la HDPA encontró fallos repetidos en revocar el acceso al sistema para el personal estacional que se había ido — un patrón común en cualquier industria con alta rotación de empleados.

Para el cumplimiento de la HDPA en contextos de idioma griego: detección de AFM y AMKA con validación de suma de verificación, soporte de NER del alfabeto griego (spaCy el_core_news), y detección de pasaporte griego/número de identificación nacional son los requisitos técnicos. Para el cumplimiento específico del sector turístico, la documentación de retención de datos del PMS de hoteles y los procedimientos de revocación de acceso del personal estacional son los requisitos organizacionales adicionales que la aplicación de la HDPA deja claros.

Fuentes:

¿Listo para proteger sus datos?

Comience a anonimizar PII con más de 285 tipos de entidades en 48 idiomas.