Atualizado para 2026
Uma solução, dois novos riscos
Muitas empresas bloqueiam vazamentos de IA removendo nomes e IDs antes que o texto chegue a um provedor de IA. Hashing unidirecional, redação rígida ou remoção total parecem seguros. A IA recebe texto limpo. Os detalhes sensíveis ficam internos.
A lógica funciona do lado da segurança. O estudo Q4 2025 da Cyberhaven descobriu que 34,8% do conteúdo enviado ao ChatGPT contém dados sensíveis. O relatório Ponemon 2024 estimou o custo médio de uma violação de IA em 2,1 milhões de dólares. O risco é real e o custo é alto.
Mas a remoção total troca um risco por outro: spoliation of evidence (destruição de provas).
Para empresas sujeitas a processos ou auditorias, destruir a capacidade de restaurar registros brutos pode contar como spoliation sob as regras federais e estaduais.
A escala do compartilhamento com IA
Pesquisas da eSecurity Planet e Cyberhaven encontraram que 77% dos funcionários compartilham dados sensíveis com ferramentas de IA toda semana. Isso abrange direito, saúde, finanças e tecnologia.
O conteúdo compartilhado frequentemente inclui:
- Cartas de clientes e notas de casos
- Rascunhos de contratos e termos
- Planos internos e registros de negócios
- Modelos financeiros e projeções
- Memorandos jurídicos e notas de casos
- Registros de pacientes e notas clínicas
- Arquivos de RH e mensagens do pessoal
Quando a remoção total é o controle de IA, cada documento que passa por ela pode perder seu valor legal. Se esses documentos surgirem em um processo — muito provável em qualquer período plurianual para empresas em setores regulados — a empresa pode ter perdido provas.
Consulte nossa visão geral de conformidade legal sobre como a anonym.legal cumpre os deveres de divulgação. O guia do sistema de tokens explica o processo técnico.
RGPD: reversibilidade é obrigatória
O Artigo 4(5) do RGPD define pseudonimização como o processamento de registros pessoais de forma que "não possam mais ser atribuídos a um titular de dados específico sem a utilização de informações adicionais, desde que essas informações adicionais sejam mantidas separadamente."
O ponto central: a chave que permite a reatribuição deve ser mantida. Os registros que podem ser revinculados por meio de chaves armazenadas contam como pseudonimizados sob o RGPD.
Os registros que não podem ser revinculados de forma alguma não são pseudonimizados. São anonimizados. A diferença importa:
- Registros mascarados por tokens mantêm algumas obrigações do RGPD mas podem ser restaurados para uso legal.
- Registros totalmente apagados podem cair fora do escopo do RGPD e não podem ser restaurados de forma alguma.
As Diretrizes 05/2022 do Comitê Europeu de Proteção de Dados confirmam que a reversibilidade é um elemento central da definição. Empresas que usam remoção unidirecional não estão fazendo pseudonimização do RGPD. Estão eliminando a capacidade de recuperar registros.
Saiba mais em nosso hub de conformidade e na visão geral de proteção.
Regras Federais: o teste de spoliation
Sob as Federal Rules of Civil Procedure, as partes devem preservar registros que possam ser relevantes para ações legais esperadas. Esse dever começa quando um processo é razoavelmente previsível — não quando é arquivado.
A Regra 37(e) permite que tribunais imponham penalidades quando uma parte deixa de preservar registros armazenados. As penalidades podem incluir:
- Instruções de inferência adversa
- Exclusão de provas
- Sanções que encerram o caso em casos graves
Veja como isso se desenrola. Uma empresa usa fluxos de trabalho de IA que removem totalmente o conteúdo sensível no curso normal dos negócios. Esses registros se tornam relevantes em um processo. A empresa os alterou de modo que o texto bruto não pode ser restaurado. Se isso ocorreu após a adesão do dever de preservar, a exposição a spoliation segue.
Este não é um caso marginal. Empresas em setores regulados com exposição legal recorrente enfrentam processos previsíveis constantes sobre amplos tipos de documentos. Implementar remoção total em todos os fluxos — sem exceções para registros em risco — cria grande risco de spoliation.
Reversível vs. unidirecional: diferença chave
A diferença entre mascaramento reversível e unidirecional está no design.
Unidirecional: sem volta
O hashing SHA-256 de um nome produz um hash fixo. O nome não pode ser derivado dele. A redação rígida remove o texto de modo que o conteúdo bruto desaparece.
Reversível: recuperação é possível
A substituição por tokens com retenção de chave e a criptografia AES-256-GCM transformam os registros de maneiras que podem ser desfeitas. Um nome substituído por um token pode ser restaurado via uma tabela de pesquisa. O conteúdo AES-256-GCM pode ser descriptografado com a chave correta. O texto bruto permanece acessível.
Para proteção de IA, ambos os métodos funcionam da mesma forma. A IA processa tokens e nunca vê os registros reais.
Para o dever legal, apenas o mascaramento reversível por tokens funciona. Os métodos unidirecionais cortam a recuperação e criam o risco de spoliation observado acima.
Leia como nosso sistema de tokens lida com isso de ponta a ponta. Para mais contexto: glossário e FAQ.
O design duplamente conforme
Um design que atende tanto à segurança de IA quanto aos deveres legais de divulgação usa mascaramento reversível por tokens AES-256-GCM:
- Os registros são processados antes de chegarem a qualquer ferramenta de IA.
- Itens sensíveis — nomes, IDs, PHI, conteúdo privilegiado — são trocados por tokens estruturados.
- O mapa de tokens é mantido em um armazenamento separado com controles de acesso que correspondem ao tipo de dados.
- O processamento de IA executa na cópia com tokens. A IA nunca vê os registros reais.
- Os resultados são restaurados usando o mapa de tokens para uso comercial normal.
- O mapa de tokens é colocado sob retenção legal quando os deveres de divulgação se aplicam.
Neste design, nenhum conteúdo bruto é perdido. O provedor de IA nunca o vê em forma utilizável. O mapa de tokens mantém a recuperação possível quando a lei exige. O risco de spoliation desaparece — nenhum registro é destruído. Eles são apenas mascarados de uma forma que pode ser desfeita.
O Artigo 4(5) do RGPD é cumprido: a chave (mapa de tokens) é mantida separadamente com as salvaguardas técnicas e de processo corretas. O dever de preservação das Regras Federais é cumprido: registros brutos podem ser restaurados quando uma retenção legal se aplica.
Explore nossa abordagem de detecção de entidades, a visão geral de proteção e os planos e tarifas.
A escolha binária
As empresas enfrentam uma bifurcação clara:
- Remover dados permanentemente — resolver o problema de vazamento de IA mas criar risco legal.
- Usar mascaramento reversível por tokens — satisfazer tanto as necessidades de proteção quanto de conformidade de uma vez.
O custo médio de violação de IA de 2,1 milhões de dólares impulsiona a decisão de segurança. Mas as sanções por spoliation também não são baratas. Em casos com altas apostas monetárias, os custos podem atingir a mesma ordem de grandeza. Ambos os riscos merecem atenção.
Uma política de IA sólida cobre ambos os aspectos. Bloqueia os registros sensíveis de sair da empresa em forma utilizável. E mantém esses mesmos registros acessíveis quando um tribunal ou regulador os solicita. O mascaramento reversível por tokens é o único método que faz os dois ao mesmo tempo.
Mais contexto: declaração do fundador e estudos de caso.
Fontes
- Cyberhaven Q4 2025: Exposição de dados em ferramentas de IA — link
- IBM / Ponemon Institute: Cost of a Data Breach Report 2024 — link
- Diretrizes CEPD 05/2022 sobre pseudonimização — link
- Federal Rules of Civil Procedure Rule 37(e) — link
- E-Discovery LLC: Relevance Redactions and Legal Standards — link