By · Last updated 2026-03-05

Voltar ao BlogTecnologia Jurídica

Após os Arquivos Epstein: Por Que a Marcação em Caixa...

A divulgação dos arquivos Epstein pelo DOJ em dezembro de 2025 expôs uma falha crítica de redação...

March 5, 20267 min de leitura
document redactionPDF redaction failurelegal complianceWord redaction

A Falha de Redação de Dezembro de 2025

Atualizado para 2026

O Departamento de Justiça dos EUA divulgou os arquivos Epstein em dezembro de 2025. A cobertura da imprensa rapidamente passou do conteúdo para as redações. Ela se concentrou em como essas redações podiam ser facilmente contornadas.

O método era simples. O conteúdo "redigido" em arquivos PDF foi enegrecido com destaque. Mas as palavras permanecem na camada de texto do PDF. Copie o quadrado preto para um editor de texto e as palavras originais aparecem. A cobertura visual não era uma exclusão real. Os dados sensíveis nunca foram removidos.

Esta não era uma falha nova. O caso Anthony Pellicano de 2007 envolveu dados sensíveis revelados por redação incorreta em documentos legais. A mesma falha apareceu durante anos em processos judiciais e relatórios governamentais. No entanto, os arquivos Epstein tornaram a falha visível para milhões de pessoas em tempo real.

Para mais informações sobre a des-identificação de documentos em contextos legais, consulte nossa visão geral de conformidade.

Cobertura Visual vs. Redação Real

Por que isso continua acontecendo? A resposta está em uma lacuna técnica fundamental. Existe uma diferença entre cobertura visual e exclusão real.

A cobertura visual coloca um elemento sobre as palavras. Ela não as remove do arquivo. Esses métodos se enquadram nesta categoria. O destaque preto define o fundo como preto. Palavras brancas em fundo branco mudam a cor para combinar com a página. Um retângulo preto desenhado sobre o texto oculta o conteúdo visualmente. A cobertura por anotação PDF adiciona uma camada opaca. Uma sobreposição de imagem coloca uma imagem preta sobre as palavras.

Em todos os casos, as palavras originais permanecem no arquivo. Elas podem ser encontradas copiando a região ou removendo a cobertura. Uma pessoa com habilidades técnicas também pode ler a estrutura bruta do arquivo.

A redação real remove definitivamente as palavras do arquivo. O conteúdo não está oculto — ele desapareceu. Não resta nada para encontrar.

A questão-chave para qualquer arquivo que você envie: quando alguém verificar este arquivo, encontrará as palavras originais? Com cobertura visual, a resposta é sim. Consulte nosso glossário para as definições dos termos de redação.

O Problema dos Documentos Word

A mesma falha existe no Microsoft Word. Usar destaque preto ou caixas opacas para "redigir" um arquivo Word deixa as palavras originais na estrutura XML do documento.

Isso importa porque o Word é o formato principal para cartas legais, contratos, arquivos de RH e revisões internas. Grupos que usam destaque têm enviado registros com dados recuperáveis ao longo de sua história.

71% das equipes jurídicas usam ferramentas de IA apesar das preocupações com o armazenamento de informações (pesquisa ACC 2025). À medida que as ferramentas de IA entram no trabalho documental, o risco de descobrir falhas de redação passadas cresce. Uma IA que lê seus arquivos pode encontrar palavras em seções "redigidas" que nunca foram realmente excluídas.

Falhas de Redação de Alto Perfil

Os arquivos Epstein não foram o primeiro caso de alto perfil desta falha.

O caso Anthony Pellicano (2007) envolveu dados sensíveis revelados por documentos incorretamente redigidos apresentados em tribunal federal. [VERIFICADO-EXTERNO]

Documentos da NSA divulgados via solicitações FOIA contiveram repetidamente palavras legíveis sob caixas pretas. Pesquisadores de segurança documentaram isso em publicações de segurança nacional. [VERIFICADO-EXTERNO]

Processos judiciais corporativos frequentemente contêm conteúdo legível quando as partes usam camadas de anotação PDF em vez de exclusão real. [VERIFICADO]

Esse padrão mostra uma lacuna básica. As equipes jurídicas pensam na redação como um ato visual. Mas os formatos PDF e Word contêm dados estruturados independentemente do que se vê na tela.

O Que a Redação Real Exige

Para que um arquivo esteja verdadeiramente redigido, as palavras devem ser removidas e substituídas. Uma pessoa qualificada não deve conseguir recuperá-las.

Em arquivos PDF, a redação real significa quatro coisas. Primeiro, achatar o PDF para remover todas as camadas editáveis. Segundo, substituir o conteúdo por caixas pretas no nível do fluxo de conteúdo. Terceiro, remover metadados que podem conter as palavras originais. Quarto, remover fontes incorporadas que poderiam permitir a recuperação.

Em arquivos Word, a redação real significa três coisas. Primeiro, encontrar cada instância do conteúdo alvo — em alterações rastreadas, comentários, metadados e histórico de revisões. Segundo, substituir o conteúdo, não cobri-lo visualmente. Terceiro, preservar a formatação sem deixar marcas.

A palavra-chave é substituição. O conteúdo original deve ser substituído por outra coisa, não oculto sob outra coisa.

Cabeçalhos, Rodapés e Zonas Ocultas

A redação de documentos legais tem mais camadas do que apenas o corpo principal. Dados sensíveis frequentemente aparecem em zonas que as ferramentas visuais ignoram completamente.

Cabeçalhos e rodapés frequentemente contêm nomes de casos, IDs de clientes e números de documentos. Enegrecer o corpo de um contrato enquanto se deixa "Confidencial — Re: TechCorp" no cabeçalho derrota o propósito.

Comentários e alterações rastreadas são uma fonte comum de divulgação involuntária. Um revisor que comenta "ver a nota de John Smith" deixa esse comentário no arquivo. Ele permanece mesmo após a cláusula ser coberta.

Propriedades do documento e metadados contêm nomes de autores e histórico de revisões. Estes podem revelar a origem do documento mesmo quando o corpo está enegrecido.

O histórico de revisões no Word preserva versões anteriores do conteúdo editado. Um arquivo que já disse "o endereço residencial do reclamante é Rua Principal, 123" mantém essa versão. Ela permanece a menos que você a limpe explicitamente.

Construindo um Processo Conforme

Dados esses modos de falha, um processo de redação sólido precisa de quatro etapas.

1. Usar integração nativa do Word para arquivos Word. A redação dentro do modelo de objeto do Word substitui o conteúdo diretamente no arquivo. Isso evita o problema de cobertura. Converter para PDF primeiro adiciona risco e pode perder comentários e histórico de revisões.

2. Processar todas as zonas do documento. Um processo conforme deve lidar com cabeçalhos, rodapés, notas de rodapé, notas finais, comentários, alterações rastreadas e propriedades do documento — não apenas o corpo principal.

3. Verificar o resultado. Após a redação, tente recuperar o conteúdo. Copie e cole as áreas redigidas. Verifique o XML do documento. Examine as alterações rastreadas e o histórico de revisões. Se conteúdo original aparecer em algum lugar, a redação está incompleta.

4. Manter uma trilha de auditoria. Para produções legais, registre o que foi redigido, por qual método e por quem. Isso importa se surgir uma disputa de privilégio. Saiba mais em nossa página de segurança e conformidade.

Lições dos Arquivos Epstein

A falha dos arquivos Epstein foi uma lição pública. Ela mostrou o que acontece quando a cobertura visual é confundida com a redação real.

Cada equipe jurídica e profissional de conformidade que acompanhou essa história deve fazer duas perguntas. Primeiro: o que há em nossas produções documentais passadas que poderia ser recuperado de forma semelhante? Segundo: nosso processo atual realmente exclui o conteúdo ou simplesmente o cobre?

As respostas determinam a exposição real — não apenas a existência de uma política de redação.


O suplemento Office da anonym.legal realiza a substituição real de PII em arquivos Word. Ele substitui o conteúdo diretamente na estrutura do documento, não visualmente sobre ela. Cabeçalhos, rodapés, notas de rodapé, comentários e alterações rastreadas são todos processados. O resultado é um arquivo do qual os dados originais estão ausentes, não ocultos. Saiba mais.

Fontes

Pronto para proteger seus dados?

Comece a anonimizar PII com mais de 285 tipos de entidades em 48 idiomas.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.