Uma ferramenta, 45 países: 260+ entidades
Plataformas globais processam dados pessoais de muitos países ao mesmo tempo. Cada país tem seus próprios formatos de identificadores. Cada formato tem suas próprias regras. Uma única ferramenta de detecção precisa lidar com todos eles. A maioria das ferramentas não consegue.
O problema da fragmentação de identificadores
Um marketplace com vendedores em 45 países recebe documentos de integração muito diferentes. Um vendedor brasileiro envia um CPF. Ele tem 11 dígitos. Dois são dígitos verificadores. Eles usam uma fórmula de ponderação específica. Um vendedor indiano envia um PAN. Ele tem 10 caracteres. Letras e dígitos aparecem em posições fixas. Um vendedor alemão envia um Steuer-ID. Ele tem 11 dígitos e um checksum Luhn. Um vendedor holandês envia um BSN. Ele tem 9 dígitos e usa validação módulo 11.
Cada formato tem comprimento e estrutura diferentes. Um regex criado para um formato não vai corresponder aos outros. Um padrão amplo de "10 a 12 dígitos" captura demais. Ele marca preços, datas e números de referência. Falsos positivos crescem rápido em escala.
A lacuna dos 40 identificadores
A maioria das ferramentas PII empresariais inclui cerca de 40 tipos de identificadores. Os mais comuns são:
- Número de Seguridade Social dos EUA
- Formato de passaporte dos EUA
- Carteira de motorista dos EUA
- Formatos genéricos de cartão de crédito com validação Luhn
- Endereços de e-mail
- Números de telefone no formato NANP
- Endereços IP
Estes cobrem bem a conformidade norte-americana. Não cobrem operações globais.
A lacuna por região
América do Sul: O CPF e o CNPJ brasileiros usam algoritmos de checksum da autoridade fiscal do Brasil. O CUIT argentino usa uma fórmula de soma ponderada diferente. O NIT colombiano tem seu próprio método de validação. Nenhum deles corresponde a padrões dos EUA.
Ásia: PAN indiano, Aadhaar, GSTIN e cartão de eleitor têm cada um um formato distinto. O My Number japonês tem 12 dígitos. O Número de Registro de Residentes da Coreia do Sul e o documento de identidade nacional chinês exigem cada um seu próprio módulo de reconhecimento.
Estados membros da UE: A cobertura completa da UE precisa de formatos IBAN para todos os 27 estados membros. Cada um tem comprimento e formato específicos do país. Também são necessários os formatos de identificação nacional de cada estado. Isso inclui Steuer-ID alemão, NIR francês, BSN holandês, PESEL polonês e Personnummer sueco. Também inclui EMŠO esloveno, OIB croata, EGN búlgaro e CNP romeno.
O que 260+ tipos de entidades cobrem
Uma biblioteca de 260+ entidades cobre todos os identificadores nacionais dos 27 estados membros da UE. Ela valida todos os formatos IBAN da UE. Cobre identificadores sul-americanos: CPF e CNPJ do Brasil, CUIT da Argentina, NIT da Colômbia. Cobre identificadores asiáticos: PAN indiano, Aadhaar, GSTIN, My Number do Japão, RRN da Coreia. Cobre identificadores do Reino Unido: NI Number, NHS Number, variantes NINO. Cobre identificadores médicos: NPI dos EUA, números DEA, formatos MRN hospitalares. Cobre identificadores financeiros: códigos SWIFT, formatos BIC, padrões de número de conta.
Por que a cobertura de detecção é uma questão de conformidade
Cada estrutura regulatória exige que seus identificadores sejam encontrados e protegidos. O RGPD cobre dados de vendedores da UE. A LGPD cobre dados de vendedores brasileiros. A Lei DPDP da Índia cobre dados de vendedores indianos.
"Proteção adequada" significa que a ferramenta encontrou o identificador. Um Aadhaar não detectado não é uma falha de configuração. É uma falha de cobertura. Para plataformas globais, essa lacuna é a diferença entre conformidade parcial e proteção real.
Uma única implantação com cobertura de 260+ entidades lida com todas essas jurisdições. Sem ferramentas regionais separadas. Sem pipelines de processamento separados. Sem enriquecimento manual para formatos que uma ferramenta de 40 reconhecedores perde.
Para detalhes sobre como a cobertura mapeia as obrigações do RGPD, consulte recursos de conformidade com o RGPD. Para políticas de trilha de auditoria e atualização, consulte detalhes de segurança e conformidade.