By · Last updated 2026-03-25

Voltar ao BlogGDPR & Conformidade

Uma Ferramenta, 45 Países: Por Que 260+ Tipos de...

O CPF brasileiro tem dígitos de verificação. O PAN indiano é alfanumérico de 10 caracteres. Os IBANs da UE variam por país.

March 25, 20267 min de leitura
global PII compliance260 entity typesBrazilian CPFIndian PANIBAN formats

Uma ferramenta, 45 países: 260+ entidades

Plataformas globais processam dados pessoais de muitos países ao mesmo tempo. Cada país tem seus próprios formatos de identificadores. Cada formato tem suas próprias regras. Uma única ferramenta de detecção precisa lidar com todos eles. A maioria das ferramentas não consegue.

O problema da fragmentação de identificadores

Um marketplace com vendedores em 45 países recebe documentos de integração muito diferentes. Um vendedor brasileiro envia um CPF. Ele tem 11 dígitos. Dois são dígitos verificadores. Eles usam uma fórmula de ponderação específica. Um vendedor indiano envia um PAN. Ele tem 10 caracteres. Letras e dígitos aparecem em posições fixas. Um vendedor alemão envia um Steuer-ID. Ele tem 11 dígitos e um checksum Luhn. Um vendedor holandês envia um BSN. Ele tem 9 dígitos e usa validação módulo 11.

Cada formato tem comprimento e estrutura diferentes. Um regex criado para um formato não vai corresponder aos outros. Um padrão amplo de "10 a 12 dígitos" captura demais. Ele marca preços, datas e números de referência. Falsos positivos crescem rápido em escala.

A lacuna dos 40 identificadores

A maioria das ferramentas PII empresariais inclui cerca de 40 tipos de identificadores. Os mais comuns são:

  • Número de Seguridade Social dos EUA
  • Formato de passaporte dos EUA
  • Carteira de motorista dos EUA
  • Formatos genéricos de cartão de crédito com validação Luhn
  • Endereços de e-mail
  • Números de telefone no formato NANP
  • Endereços IP

Estes cobrem bem a conformidade norte-americana. Não cobrem operações globais.

A lacuna por região

América do Sul: O CPF e o CNPJ brasileiros usam algoritmos de checksum da autoridade fiscal do Brasil. O CUIT argentino usa uma fórmula de soma ponderada diferente. O NIT colombiano tem seu próprio método de validação. Nenhum deles corresponde a padrões dos EUA.

Ásia: PAN indiano, Aadhaar, GSTIN e cartão de eleitor têm cada um um formato distinto. O My Number japonês tem 12 dígitos. O Número de Registro de Residentes da Coreia do Sul e o documento de identidade nacional chinês exigem cada um seu próprio módulo de reconhecimento.

Estados membros da UE: A cobertura completa da UE precisa de formatos IBAN para todos os 27 estados membros. Cada um tem comprimento e formato específicos do país. Também são necessários os formatos de identificação nacional de cada estado. Isso inclui Steuer-ID alemão, NIR francês, BSN holandês, PESEL polonês e Personnummer sueco. Também inclui EMŠO esloveno, OIB croata, EGN búlgaro e CNP romeno.

O que 260+ tipos de entidades cobrem

Uma biblioteca de 260+ entidades cobre todos os identificadores nacionais dos 27 estados membros da UE. Ela valida todos os formatos IBAN da UE. Cobre identificadores sul-americanos: CPF e CNPJ do Brasil, CUIT da Argentina, NIT da Colômbia. Cobre identificadores asiáticos: PAN indiano, Aadhaar, GSTIN, My Number do Japão, RRN da Coreia. Cobre identificadores do Reino Unido: NI Number, NHS Number, variantes NINO. Cobre identificadores médicos: NPI dos EUA, números DEA, formatos MRN hospitalares. Cobre identificadores financeiros: códigos SWIFT, formatos BIC, padrões de número de conta.

Por que a cobertura de detecção é uma questão de conformidade

Cada estrutura regulatória exige que seus identificadores sejam encontrados e protegidos. O RGPD cobre dados de vendedores da UE. A LGPD cobre dados de vendedores brasileiros. A Lei DPDP da Índia cobre dados de vendedores indianos.

"Proteção adequada" significa que a ferramenta encontrou o identificador. Um Aadhaar não detectado não é uma falha de configuração. É uma falha de cobertura. Para plataformas globais, essa lacuna é a diferença entre conformidade parcial e proteção real.

Uma única implantação com cobertura de 260+ entidades lida com todas essas jurisdições. Sem ferramentas regionais separadas. Sem pipelines de processamento separados. Sem enriquecimento manual para formatos que uma ferramenta de 40 reconhecedores perde.

Para detalhes sobre como a cobertura mapeia as obrigações do RGPD, consulte recursos de conformidade com o RGPD. Para políticas de trilha de auditoria e atualização, consulte detalhes de segurança e conformidade.

Fontes

Pronto para proteger seus dados?

Comece a anonimizar PII com mais de 285 tipos de entidades em 48 idiomas.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.