By · Last updated 2026-06-05

Voltar ao BlogGDPR & Conformidade

ANSPDCP e GDPR romeno: Por que a detecção de CNP com...

A ANSPDCP descobriu que 78% das ferramentas não detectam o CNP romeno com a validação adequada.

June 5, 20267 min de leitura
Romania ANSPDCPCNP checksum validationRomanian GDPRBPO complianceRomanian identifiers

ANSPDCP Roménia: Deteção do CNP e Verificações RGPD

Atualizado para 2026

A autoridade de proteção de dados da Roménia é a ANSPDCP. A sua avaliação de 2024 concluiu que 78 % das ferramentas DCP não detetam corretamente o Cod Numeric Personal (CNP). A maioria ignora a etapa de verificação da soma de controlo. Essa lacuna cria um risco real de conformidade. A Roménia processa dados da UE para muitos clientes ocidentais. A exposição é ampla.

O Documento de Identidade Nacional da Roménia com Mais Dados

O CNP é um identificador nacional de 13 dígitos. Cada grupo de dígitos contém dados pessoais:

  • Dígito 1: Código de género e século. Homem nascido 1900–1999 = 1. Mulher nascida 1900–1999 = 2. Homem nascido 2000+ = 5. Mulher nascida 2000+ = 6. Homem residente estrangeiro = 7. Mulher residente estrangeira = 8. Outro residente = 9.
  • Dígitos 2–3: Dois últimos dígitos do ano de nascimento.
  • Dígitos 4–5: Mês de nascimento (01–12).
  • Dígitos 6–7: Dia de nascimento (01–31).
  • Dígitos 8–9: Código de distrito. Cobre 41 distritos e os seis setores de Bucareste (códigos 01–52).
  • Dígitos 10–12: Ordem de nascimento nesse dia e distrito.
  • Dígito 13: Dígito de controlo.

O dígito 1 por si só revela o sexo biológico. Nos termos do artigo 9.º do RGPD, este número torna-se um dado de categoria especial. Precisa de proteção mais forte do que os dados pessoais comuns.

Como funciona o dígito de controlo: Tome os primeiros 12 dígitos. Multiplique cada um pelo seu peso (2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9). Some os resultados. Divida por 11 e tome o resto. Um resto de 10 dá o dígito de controlo 1. Um resto de 11 significa que o código não é válido. Qualquer outro resto é o dígito de controlo.

As ferramentas que ignoram este teste têm dois modos de falha. Primeiro, qualquer cadeia de 13 dígitos é sinalizada como correspondência (falsos positivos). Segundo, um número corrompido passa a verificação de padrão mas contém dados incorretos. Esses dados passam despercebidos e não são revistos (falsos negativos).

Problemas de NER em Documentos em Língua Romena

Encontrar identificadores é apenas parte do trabalho. O texto romeno cria mais obstáculos à deteção.

Diacríticos: O romeno usa ș, ț, ă, â e î. Ferramentas treinadas noutros idiomas frequentemente não identificam nomes com estas letras. Documentos antigos em codificação Latin-2 adicionam mais falhas.

Formatos de morada: Os tipos de rua usam formas curtas — Str., Bd., Al., Cal. Os nomes de cidades e municípios seguem regras locais. Analisadores criados para moradas francesas ou alemãs têm mau desempenho aqui.

Flexão de nomes: Os nomes mudam de forma consoante o caso gramatical em romeno. O mesmo nome de uma pessoa aparece de forma diferente em partes distintas de uma frase. Os modelos NER precisam de lidar com isto para associar nomes num documento.

Consulte o nosso guia de deteção de DCP na APAC sobre como as lacunas linguísticas afetam a deteção em scripts não ocidentais.

Como os Casos da ANSPDCP se Desenvolvem

Os casos da ANSPDCP mostram três padrões.

Casos de violação em BPO: Ficheiros partilhados contêm números de ID de funcionários e dados de clientes da UE sem cifra. Registos deficientes impedem a empresa de saber a que registos se acedeu. Isso prolonga a investigação e aumenta a coima.

Exposição de dados de saúde: Processos de doentes — o ID nacional, o ID do cartão de saúde e o diagnóstico — chegam à pessoa errada. A ferramenta DCP não tinha suporte para este formato. Os dados saíram sem mascaramento.

Falhas em transferências transfronteiriças: Uma empresa de externalização envia registos ligados a identificadores para uma parte fora do EEE. Sem Transfer Impact Assessment. Sem Standard Contractual Clauses. O estatuto do artigo 9 dos dados transforma uma lacuna rotineira numa violação mais grave.

Três Controlos para a Conformidade com a ANSPDCP

Estes três formam a base técnica mínima:

  1. Deteção do CNP com validação módulo 11 — a correspondência de padrões por si só não é suficiente.
  2. NER com reconhecimento de diacríticos — cobrir ș, ț, ă, â e î em fontes UTF-8 e Latin-2.
  3. Deteção do cartão de identidade — o cartão nacional aparece juntamente com o CNP em muitos tipos de documentos.

Para uma visão mais ampla de como os documentos nacionais criam riscos de RGPD, consulte o nosso guia de deteção de identificadores fiscais nacionais da UE.

Fontes

Pronto para proteger seus dados?

Comece a anonimizar PII com mais de 285 tipos de entidades em 48 idiomas.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.