By · Last updated 2026-03-15

Voltar ao BlogTecnologia Jurídica

A Armadilha da Anonimização Permanente...

34,8% das entradas do ChatGPT contêm dados sensíveis (Cyberhaven). A solução — anonimização permanente — cria seu próprio risco legal: spoliation.

March 15, 202610 min de leitura
reversible encryptionspoliation risklegal discovery complianceGDPR pseudonymizationAES-256-GCM

Atualizado para 2026

Uma solução, dois novos riscos

Muitas empresas bloqueiam vazamentos de IA removendo nomes e IDs antes que o texto chegue a um provedor de IA. Hashing unidirecional, redação rígida ou remoção total parecem seguros. A IA recebe texto limpo. Os detalhes sensíveis ficam internos.

A lógica funciona do lado da segurança. O estudo Q4 2025 da Cyberhaven descobriu que 34,8% do conteúdo enviado ao ChatGPT contém dados sensíveis. O relatório Ponemon 2024 estimou o custo médio de uma violação de IA em 2,1 milhões de dólares. O risco é real e o custo é alto.

Mas a remoção total troca um risco por outro: spoliation of evidence (destruição de provas).

Para empresas sujeitas a processos ou auditorias, destruir a capacidade de restaurar registros brutos pode contar como spoliation sob as regras federais e estaduais.

A escala do compartilhamento com IA

Pesquisas da eSecurity Planet e Cyberhaven encontraram que 77% dos funcionários compartilham dados sensíveis com ferramentas de IA toda semana. Isso abrange direito, saúde, finanças e tecnologia.

O conteúdo compartilhado frequentemente inclui:

  • Cartas de clientes e notas de casos
  • Rascunhos de contratos e termos
  • Planos internos e registros de negócios
  • Modelos financeiros e projeções
  • Memorandos jurídicos e notas de casos
  • Registros de pacientes e notas clínicas
  • Arquivos de RH e mensagens do pessoal

Quando a remoção total é o controle de IA, cada documento que passa por ela pode perder seu valor legal. Se esses documentos surgirem em um processo — muito provável em qualquer período plurianual para empresas em setores regulados — a empresa pode ter perdido provas.

Consulte nossa visão geral de conformidade legal sobre como a anonym.legal cumpre os deveres de divulgação. O guia do sistema de tokens explica o processo técnico.

RGPD: reversibilidade é obrigatória

O Artigo 4(5) do RGPD define pseudonimização como o processamento de registros pessoais de forma que "não possam mais ser atribuídos a um titular de dados específico sem a utilização de informações adicionais, desde que essas informações adicionais sejam mantidas separadamente."

O ponto central: a chave que permite a reatribuição deve ser mantida. Os registros que podem ser revinculados por meio de chaves armazenadas contam como pseudonimizados sob o RGPD.

Os registros que não podem ser revinculados de forma alguma não são pseudonimizados. São anonimizados. A diferença importa:

  • Registros mascarados por tokens mantêm algumas obrigações do RGPD mas podem ser restaurados para uso legal.
  • Registros totalmente apagados podem cair fora do escopo do RGPD e não podem ser restaurados de forma alguma.

As Diretrizes 05/2022 do Comitê Europeu de Proteção de Dados confirmam que a reversibilidade é um elemento central da definição. Empresas que usam remoção unidirecional não estão fazendo pseudonimização do RGPD. Estão eliminando a capacidade de recuperar registros.

Saiba mais em nosso hub de conformidade e na visão geral de proteção.

Regras Federais: o teste de spoliation

Sob as Federal Rules of Civil Procedure, as partes devem preservar registros que possam ser relevantes para ações legais esperadas. Esse dever começa quando um processo é razoavelmente previsível — não quando é arquivado.

A Regra 37(e) permite que tribunais imponham penalidades quando uma parte deixa de preservar registros armazenados. As penalidades podem incluir:

  • Instruções de inferência adversa
  • Exclusão de provas
  • Sanções que encerram o caso em casos graves

Veja como isso se desenrola. Uma empresa usa fluxos de trabalho de IA que removem totalmente o conteúdo sensível no curso normal dos negócios. Esses registros se tornam relevantes em um processo. A empresa os alterou de modo que o texto bruto não pode ser restaurado. Se isso ocorreu após a adesão do dever de preservar, a exposição a spoliation segue.

Este não é um caso marginal. Empresas em setores regulados com exposição legal recorrente enfrentam processos previsíveis constantes sobre amplos tipos de documentos. Implementar remoção total em todos os fluxos — sem exceções para registros em risco — cria grande risco de spoliation.

Reversível vs. unidirecional: diferença chave

A diferença entre mascaramento reversível e unidirecional está no design.

Unidirecional: sem volta

O hashing SHA-256 de um nome produz um hash fixo. O nome não pode ser derivado dele. A redação rígida remove o texto de modo que o conteúdo bruto desaparece.

Reversível: recuperação é possível

A substituição por tokens com retenção de chave e a criptografia AES-256-GCM transformam os registros de maneiras que podem ser desfeitas. Um nome substituído por um token pode ser restaurado via uma tabela de pesquisa. O conteúdo AES-256-GCM pode ser descriptografado com a chave correta. O texto bruto permanece acessível.

Para proteção de IA, ambos os métodos funcionam da mesma forma. A IA processa tokens e nunca vê os registros reais.

Para o dever legal, apenas o mascaramento reversível por tokens funciona. Os métodos unidirecionais cortam a recuperação e criam o risco de spoliation observado acima.

Leia como nosso sistema de tokens lida com isso de ponta a ponta. Para mais contexto: glossário e FAQ.

O design duplamente conforme

Um design que atende tanto à segurança de IA quanto aos deveres legais de divulgação usa mascaramento reversível por tokens AES-256-GCM:

  1. Os registros são processados antes de chegarem a qualquer ferramenta de IA.
  2. Itens sensíveis — nomes, IDs, PHI, conteúdo privilegiado — são trocados por tokens estruturados.
  3. O mapa de tokens é mantido em um armazenamento separado com controles de acesso que correspondem ao tipo de dados.
  4. O processamento de IA executa na cópia com tokens. A IA nunca vê os registros reais.
  5. Os resultados são restaurados usando o mapa de tokens para uso comercial normal.
  6. O mapa de tokens é colocado sob retenção legal quando os deveres de divulgação se aplicam.

Neste design, nenhum conteúdo bruto é perdido. O provedor de IA nunca o vê em forma utilizável. O mapa de tokens mantém a recuperação possível quando a lei exige. O risco de spoliation desaparece — nenhum registro é destruído. Eles são apenas mascarados de uma forma que pode ser desfeita.

O Artigo 4(5) do RGPD é cumprido: a chave (mapa de tokens) é mantida separadamente com as salvaguardas técnicas e de processo corretas. O dever de preservação das Regras Federais é cumprido: registros brutos podem ser restaurados quando uma retenção legal se aplica.

Explore nossa abordagem de detecção de entidades, a visão geral de proteção e os planos e tarifas.

A escolha binária

As empresas enfrentam uma bifurcação clara:

  • Remover dados permanentemente — resolver o problema de vazamento de IA mas criar risco legal.
  • Usar mascaramento reversível por tokens — satisfazer tanto as necessidades de proteção quanto de conformidade de uma vez.

O custo médio de violação de IA de 2,1 milhões de dólares impulsiona a decisão de segurança. Mas as sanções por spoliation também não são baratas. Em casos com altas apostas monetárias, os custos podem atingir a mesma ordem de grandeza. Ambos os riscos merecem atenção.

Uma política de IA sólida cobre ambos os aspectos. Bloqueia os registros sensíveis de sair da empresa em forma utilizável. E mantém esses mesmos registros acessíveis quando um tribunal ou regulador os solicita. O mascaramento reversível por tokens é o único método que faz os dois ao mesmo tempo.

Mais contexto: declaração do fundador e estudos de caso.

Fontes

  • Cyberhaven Q4 2025: Exposição de dados em ferramentas de IA — link
  • IBM / Ponemon Institute: Cost of a Data Breach Report 2024 — link
  • Diretrizes CEPD 05/2022 sobre pseudonimização — link
  • Federal Rules of Civil Procedure Rule 37(e) — link
  • E-Discovery LLC: Relevance Redactions and Legal Standards — link

Pronto para proteger seus dados?

Comece a anonimizar PII com mais de 285 tipos de entidades em 48 idiomas.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.