By · Last updated 2026-06-05

Voltar ao BlogGDPR & Conformidade

Detecção de PII em Alemão: Por que a Conformidade com...

O BfDI relatou 27.829 notificações de violação em 2024 — o recorde histórico da Alemanha.

June 5, 20269 min de leitura
Germany BfDIDACH complianceSteuer-ID detectionGerman language PIIDSGVO technical

Deteção de Dados Pessoais em Alemão para Conformidade com o RGPD

Atualizado em 2026

A Alemanha comunicou 27.829 violações de dados ao BfDI e às 16 autoridades regionais em 2024 — um novo recorde absoluto. Isso representa 31 % de todas as notificações RGPD na UE. Estes números revelam não apenas uma cultura ativa de reporte. Revelam também uma lacuna técnica: 65 % das empresas alemãs utilizam ferramentas de deteção de dados pessoais com suporte insuficiente para a língua alemã.

Execução em Três Níveis na Alemanha

A execução do RGPD na Alemanha é complexa. Distribui-se por 17 autoridades.

BfDI (Comissário Federal): Competente para autoridades federais, telecomunicações, serviços postais e organizações com operações em vários estados federais.

16 Landesdatenschutzbehörden: Cada estado federal tem a sua própria autoridade com poderes de execução independentes. As autoridades mais ativas:

  • Baviera – BayLDA: Considerada uma das autoridades de proteção de dados mais exigentes do ponto de vista técnico na UE. Em 2024 auditou mais de 250 organizações.
  • Hamburgo: Pioneira na execução contra operadores de plataformas norte-americanas.
  • Baden-Württemberg – LfDI BW: Publicou as primeiras orientações RGPD específicas para IA na Alemanha.

As empresas na Alemanha podem ser inspecionadas simultaneamente a nível federal e estadual. Isso aumenta consideravelmente os requisitos de documentação.

Complexidade DACH: Três Enquadramentos Legais, Uma Língua

As organizações de língua alemã no espaço DACH operam sob três enquadramentos regulatórios distintos.

Alemanha: RGPD da UE com BfDI e Landesdatenschutzbehörden. Identificadores específicos: Steueridentifikationsnummer (11 dígitos), Personalausweisnummer (10 caracteres), IBAN no formato DE.

Áustria: RGPD da UE com execução pelo DSB. Identificadores austríacos: Sozialversicherungsnummer (SVNR, 10 dígitos), eAT (título de residência eletrónico), número FinanzOnline.

Suíça: revDSG (em vigor desde setembro de 2023) — não é o RGPD da UE, mas é estreitamente inspirado nele. Identificadores suíços: número AHV (13 dígitos, formato 756.XXXX.XXXX.XX), UID (identificação de empresas).

Qualquer organização ativa nos três países necessita de uma ferramenta PII capaz de processar texto em alemão e todos os identificadores nacionais dos três países. Deve ainda considerar-se a DSG do Liechtenstein como quarto enquadramento menor.

Identificadores Alemães em Detalhe

Steueridentifikationsnummer (Steuer-ID): Número de identificação fiscal permanente com 11 dígitos atribuído a todos os residentes alemães desde o nascimento. O primeiro dígito não pode ser zero. O dígito de verificação no final é calculado por algoritmo modular. Aparece em todos os documentos fiscais, laborais e financeiros alemães.

Personalausweisnummer: Formato LNNNNNNNC (1 letra + 8 dígitos + 1 carácter de verificação). O carácter de verificação é calculado por um algoritmo de soma ponderada. Todo o cidadão alemão e todo o cidadão da UE residente na Alemanha tem um número de Personalausweis.

Sozialversicherungsnummer (SV-Nummer): Formato NNDDMMYYAAAA (código de área com 2 dígitos + data de nascimento + 2 letras do apelido + dígito de verificação). Utilizado em documentos de emprego e pensões.

IBAN alemão: Formato DE + 2 dígitos de verificação + código bancário (Bankleitzahl, BLZ) com 8 dígitos + número de conta com 10 dígitos. Para além da validação IBAN mod-97, o formato BLZ deve também ser validado.

Krankenversicherungsnummer (KVNr): Número de seguro de saúde com 10 caracteres (1 letra + 9 dígitos). A letra identifica a seguradora; os dígitos incluem um dígito de verificação.

A Lacuna de 65 % das Ferramentas

Segundo o inquérito do BfDI de 2024, 65 % das empresas alemãs utilizam ferramentas PII com suporte insuficiente para a língua alemã. Falhas específicas documentadas:

Deteção do Steuer-ID: Os padrões são comparados sem validação do dígito de verificação. Isso gera numerosos falsos positivos com qualquer sequência de 11 dígitos em documentos alemães.

Deteção do Personalausweis: Ocorrem erros quando o formato aparece sem a menção explícita de «Personalausweis». A deteção contextual requer NER em alemão para identificar corretamente o tipo de documento.

Reconhecimento de nomes alemães: Os modelos NLP treinados com texto em inglês reconhecem mal os nomes alemães. Os mais afetados: nomes compostos (Hans-Wilhelm, Anna-Katharina) e nomes com umlaut (Müller, Schröder, Böhm).

Formatos de morada alemães: Straße, Platz, Weg e Gasse diferem estruturalmente dos formatos de morada anglófonos. Os analisadores em inglês geram erros sistemáticos com moradas alemãs.

O padrão de conformidade para o BfDI, o BayLDA e outras autoridades alemãs é: NER em alemão (spaCy de_core_news ou equivalente), deteção do Steuer-ID e do Personalausweis com validação de soma de verificação, suporte de SVNR para documentos austríacos e número AHV para documentos suíços.

Para mais informação sobre problemas de deteção multilingue, consulte o guia de deteção multilingue de dados pessoais para conformidade com o RGPD. As prioridades de execução técnica do BfDI estão documentadas no guia técnico do BfDI para empresas alemãs. Para identificadores fiscais nacionais alemães e europeus, consulte o guia de deteção de identificadores fiscais da UE.

Fontes

Pronto para proteger seus dados?

Comece a anonimizar PII com mais de 285 tipos de entidades em 48 idiomas.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.