Datos personales globales: SSN, CPF, Aadhaar y más
El problema de las herramientas PII centradas en EE. UU.
La mayoría de las herramientas PII fueron desarrolladas en Estados Unidos. Se orientan a formatos de datos estadounidenses. El número de Seguro Social tiene nueve dígitos en formato AAA-BB-CCCC. Sus segmentos de área, grupo y serie siguen reglas documentadas. Las herramientas centradas en EE. UU. lo detectan bien. También detectan números de teléfono, correos electrónicos y licencias de conducir estadounidenses. Pasan por alto cada identificador nacional utilizado fuera de EE. UU.
El RGPD no permite una exención para sistemas que solo tratan datos de EE. UU. Tomemos el Steuer-ID alemán. Es un identificador fiscal de 11 dígitos. Lo emite el Bundeszentralamt für Steuern. Su último dígito es una suma de comprobación. Identifica a un residente alemán igual que un SSN identifica a un estadounidense. El artículo 4 del RGPD cubre «cualquier información relativa a una persona física identificada o identificable.» Un Steuer-ID cumple esa definición. Es un dato personal. Eso es así tanto si su herramienta conoce el formato como si no.
Se han impuesto multas del RGPD por la exposición de datos personales específicos de la UE en sistemas que solo usaban herramientas estadounidenses. La brecha de cumplimiento es real. Se han adoptado medidas coercitivas. Consulte nuestra guía de cumplimiento RGPD para más contexto.
El panorama de identificadores europeos
La brecha de cobertura es amplia. Aquí se presenta un desglose por país.
Alemania: Steuer-ID — 11 dígitos, validado con suma de comprobación. Sozialversicherungsnummer — 12 campos, estructurado. Reisepass — 10 caracteres con códigos de autoridad.
Francia: El NIR es el identificador nacional de la seguridad social. Tiene 15 dígitos. Codifican el sexo, el año de nacimiento, el mes de nacimiento, el departamento, el municipio y una clave de control. El SIRET tiene 14 dígitos. El SIREN tiene nueve.
Suecia: El Personnummer usa el formato AAMMDD-XXXX. El Samordningsnummer cubre a los no residentes. El valor del día se desplaza en 60.
Noruega: El Fødselsnummer tiene 11 valores en formato DDMMAAXXXCC. El sexo se codifica en el grupo central. El D-nummer desplaza el valor del día en 40.
Brasil: El CPF — Cadastro de Pessoas Físicas — tiene 11 dígitos con dos valores de control. El CNPJ es el identificador empresarial de 14 dígitos.
India: Aadhaar es un identificador biométrico de 12 dígitos. Usa una verificación Verhoeff. El PAN es un identificador fiscal de 10 dígitos con letras y números.
EAU: El Emirates ID tiene 15 números en el formato 784-año de nacimiento-secuencia-control.
Un equipo global de Recursos Humanos que cubre 12 países necesita una sola herramienta. Debe gestionar los 12 formatos de identificadores nacionales en un único proceso. Mantener bibliotecas de expresiones regulares separadas por país no es viable.
La arquitectura de 285+ tipos de entidades
La biblioteca de 285+ tipos de entidades cubre todos los formatos de los estados miembros de la UE. También cubre los principales identificadores de APAC. Entre ellos se encuentran Aadhaar, PAN, CPF, CNPJ, Emirates ID y el identificador de ciudadano tailandés. Los formatos de EE. UU. — SSN, EIN, licencias de conducir por estado — también están incluidos. Un único motor los gestiona todos. La biblioteca se actualiza cuando los formatos cambian.
Esta es la brecha que la mayoría de las herramientas deja abierta. Consulte la referencia de entidades para revisar qué está cubierto. Para precios de API por volumen, visite precios.