Atualizado para 2026

Uma solução, dois novos riscos

Muitas empresas bloqueiam vazamentos de IA removendo nomes e IDs antes que o texto chegue a um provedor de IA. Hashing unidirecional, redação rígida ou remoção total parecem seguros. A IA recebe texto limpo. Os detalhes sensíveis ficam internos.

A lógica funciona do lado da segurança. O estudo Q4 2025 da Cyberhaven descobriu que 34,8% do conteúdo enviado ao ChatGPT contém dados sensíveis. O relatório Ponemon 2024 estimou o custo médio de uma violação de IA em 2,1 milhões de dólares. O risco é real e o custo é alto.

Mas a remoção total troca um risco por outro: spoliation of evidence (destruição de provas).

Para empresas sujeitas a processos ou auditorias, destruir a capacidade de restaurar registros brutos pode contar como spoliation sob as regras federais e estaduais.

A escala do compartilhamento com IA

Pesquisas da eSecurity Planet e Cyberhaven encontraram que 77% dos funcionários compartilham dados sensíveis com ferramentas de IA toda semana. Isso abrange direito, saúde, finanças e tecnologia.

O conteúdo compartilhado frequentemente inclui:

Cartas de clientes e notas de casos
Rascunhos de contratos e termos
Planos internos e registros de negócios
Modelos financeiros e projeções
Memorandos jurídicos e notas de casos
Registros de pacientes e notas clínicas
Arquivos de RH e mensagens do pessoal

Quando a remoção total é o controle de IA, cada documento que passa por ela pode perder seu valor legal. Se esses documentos surgirem em um processo — muito provável em qualquer período plurianual para empresas em setores regulados — a empresa pode ter perdido provas.

Consulte nossa visão geral de conformidade legal sobre como a anonym.legal cumpre os deveres de divulgação. O guia do sistema de tokens explica o processo técnico.

RGPD: reversibilidade é obrigatória

O Artigo 4(5) do RGPD define pseudonimização como o processamento de registros pessoais de forma que "não possam mais ser atribuídos a um titular de dados específico sem a utilização de informações adicionais, desde que essas informações adicionais sejam mantidas separadamente."

O ponto central: a chave que permite a reatribuição deve ser mantida. Os registros que podem ser revinculados por meio de chaves armazenadas contam como pseudonimizados sob o RGPD.

Os registros que não podem ser revinculados de forma alguma não são pseudonimizados. São anonimizados. A diferença importa:

Registros mascarados por tokens mantêm algumas obrigações do RGPD mas podem ser restaurados para uso legal.
Registros totalmente apagados podem cair fora do escopo do RGPD e não podem ser restaurados de forma alguma.

As Diretrizes 05/2022 do Comitê Europeu de Proteção de Dados confirmam que a reversibilidade é um elemento central da definição. Empresas que usam remoção unidirecional não estão fazendo pseudonimização do RGPD. Estão eliminando a capacidade de recuperar registros.

Saiba mais em nosso hub de conformidade e na visão geral de proteção.

Regras Federais: o teste de spoliation

Sob as Federal Rules of Civil Procedure, as partes devem preservar registros que possam ser relevantes para ações legais esperadas. Esse dever começa quando um processo é razoavelmente previsível — não quando é arquivado.

A Regra 37(e) permite que tribunais imponham penalidades quando uma parte deixa de preservar registros armazenados. As penalidades podem incluir:

Instruções de inferência adversa
Exclusão de provas
Sanções que encerram o caso em casos graves

Veja como isso se desenrola. Uma empresa usa fluxos de trabalho de IA que removem totalmente o conteúdo sensível no curso normal dos negócios. Esses registros se tornam relevantes em um processo. A empresa os alterou de modo que o texto bruto não pode ser restaurado. Se isso ocorreu após a adesão do dever de preservar, a exposição a spoliation segue.

Este não é um caso marginal. Empresas em setores regulados com exposição legal recorrente enfrentam processos previsíveis constantes sobre amplos tipos de documentos. Implementar remoção total em todos os fluxos — sem exceções para registros em risco — cria grande risco de spoliation.

Reversível vs. unidirecional: diferença chave

A diferença entre mascaramento reversível e unidirecional está no design.

Unidirecional: sem volta

O hashing SHA-256 de um nome produz um hash fixo. O nome não pode ser derivado dele. A redação rígida remove o texto de modo que o conteúdo bruto desaparece.

Reversível: recuperação é possível

A substituição por tokens com retenção de chave e a criptografia AES-256-GCM transformam os registros de maneiras que podem ser desfeitas. Um nome substituído por um token pode ser restaurado via uma tabela de pesquisa. O conteúdo AES-256-GCM pode ser descriptografado com a chave correta. O texto bruto permanece acessível.

Para proteção de IA, ambos os métodos funcionam da mesma forma. A IA processa tokens e nunca vê os registros reais.

Para o dever legal, apenas o mascaramento reversível por tokens funciona. Os métodos unidirecionais cortam a recuperação e criam o risco de spoliation observado acima.

Leia como nosso sistema de tokens lida com isso de ponta a ponta. Para mais contexto: glossário e FAQ.

O design duplamente conforme

Um design que atende tanto à segurança de IA quanto aos deveres legais de divulgação usa mascaramento reversível por tokens AES-256-GCM:

Os registros são processados antes de chegarem a qualquer ferramenta de IA.
Itens sensíveis — nomes, IDs, PHI, conteúdo privilegiado — são trocados por tokens estruturados.
O mapa de tokens é mantido em um armazenamento separado com controles de acesso que correspondem ao tipo de dados.
O processamento de IA executa na cópia com tokens. A IA nunca vê os registros reais.
Os resultados são restaurados usando o mapa de tokens para uso comercial normal.
O mapa de tokens é colocado sob retenção legal quando os deveres de divulgação se aplicam.

Neste design, nenhum conteúdo bruto é perdido. O provedor de IA nunca o vê em forma utilizável. O mapa de tokens mantém a recuperação possível quando a lei exige. O risco de spoliation desaparece — nenhum registro é destruído. Eles são apenas mascarados de uma forma que pode ser desfeita.

O Artigo 4(5) do RGPD é cumprido: a chave (mapa de tokens) é mantida separadamente com as salvaguardas técnicas e de processo corretas. O dever de preservação das Regras Federais é cumprido: registros brutos podem ser restaurados quando uma retenção legal se aplica.

Explore nossa abordagem de detecção de entidades, a visão geral de proteção e os planos e tarifas.

A escolha binária

As empresas enfrentam uma bifurcação clara:

Remover dados permanentemente — resolver o problema de vazamento de IA mas criar risco legal.
Usar mascaramento reversível por tokens — satisfazer tanto as necessidades de proteção quanto de conformidade de uma vez.

O custo médio de violação de IA de 2,1 milhões de dólares impulsiona a decisão de segurança. Mas as sanções por spoliation também não são baratas. Em casos com altas apostas monetárias, os custos podem atingir a mesma ordem de grandeza. Ambos os riscos merecem atenção.

Uma política de IA sólida cobre ambos os aspectos. Bloqueia os registros sensíveis de sair da empresa em forma utilizável. E mantém esses mesmos registros acessíveis quando um tribunal ou regulador os solicita. O mascaramento reversível por tokens é o único método que faz os dois ao mesmo tempo.

Mais contexto: declaração do fundador e estudos de caso.

Fontes

Cyberhaven Q4 2025: Exposição de dados em ferramentas de IA — link
IBM / Ponemon Institute: Cost of a Data Breach Report 2024 — link
Diretrizes CEPD 05/2022 sobre pseudonimização — link
Federal Rules of Civil Procedure Rule 37(e) — link
E-Discovery LLC: Relevance Redactions and Legal Standards — link

Pronto para proteger seus dados?

Comece a anonimizar PII com mais de 285 tipos de entidades em 48 idiomas.

Iniciar Teste Gratuito Ver Recursos

A Armadilha da Anonimização Permanente...

Uma solução, dois novos riscos

A escala do compartilhamento com IA

RGPD: reversibilidade é obrigatória

Regras Federais: o teste de spoliation

Reversível vs. unidirecional: diferença chave

Unidirecional: sem volta

Reversível: recuperação é possível

O design duplamente conforme

A escolha binária

Fontes

Artigos Relacionados

Mixed Format E-Discovery: Compliance Gap

The PDF Redaction Trap: Data Exposed

Legal PII: Privilege Detection

Pronto para proteger seus dados?

A Armadilha da Anonimização Permanente...

Uma solução, dois novos riscos

A escala do compartilhamento com IA

RGPD: reversibilidade é obrigatória

Regras Federais: o teste de spoliation

Reversível vs. unidirecional: diferença chave

Unidirecional: sem volta

Reversível: recuperação é possível

O design duplamente conforme

A escolha binária

Fontes

Artigos Relacionados

Mixed Format E-Discovery: Compliance Gap

The PDF Redaction Trap: Data Exposed

Legal PII: Privilege Detection

Pronto para proteger seus dados?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow