title: "Sanções em e-discovery: quando a IA redige demais" description: "No caso Athletics Investment Group v. Schnitzer Steel (2024), redações indevidas geraram sanções de discovery. Com precisão de IA de apenas 22,7 %, equipes jurídicas enfrentam responsabilidade real." category: legal-tech publishedAt: 2026-03-12 tags:
- sanções e-discovery
- responsabilidade por redação
- precisão redação IA
- revisão de documentos
- tecnologia jurídica readingTime: 10
Atualizado para 2026
Duas Formas de Falha na Redação
As equipes jurídicas enfrentam dois modos de falha. Ambos criam responsabilidade real.
A sub-redação expõe dados privilegiados ou informações pessoais que devem permanecer ocultas. A parte produtora divulga material que tinha o direito — e muitas vezes o dever — de proteger.
A sobre-redação retém fatos que o advogado contrário tem direito de acessar. Os tribunais tratam isso como obstrução. É uma violação sancionável do procedimento de discovery.
Ferramentas de IA que priorizam o recall em detrimento da precisão criam o segundo problema por design. Um motor que tacha 80 % de um documento para não perder nada produz resultados inúteis. Também pode gerar sanções judiciais.
Ambos os modos de falha levam ao mesmo lugar: um juiz, uma explicação e custos.
O Caso Schnitzer Steel (2024)
O caso Athletics Investment Group v. Schnitzer Steel de 2024 mostra como os tribunais respondem à retenção indevida de documentos em e-discovery.
Uma parte produziu documentos com marcações extensas. O advogado contrário as contestou. O tribunal examinou o material. Constatou que as marcações ultrapassavam o que a lei permitia.
O resultado: sanções nos termos da Federal Rule of Civil Procedure 37. A parte produtora arcou com o custo de um processo falho.
Essas sanções não são novidade. Os tribunais as aplicam há anos. O que distingue este caso é o momento. A revisão assistida por IA é agora comum em litígios. O caso levanta uma pergunta prática: as equipes verificaram a precisão de suas ferramentas de IA antes de usá-las em produção?
A resposta importa. Uma ferramenta com baixa precisão vai marcar muito mais do que deveria. O advogado que confia nela sem verificar arca com o risco.
Para uma análise detalhada do caso, veja E-Discovery LLC sobre proibição de redações por relevância.
O Problema de Precisão de 22,7 %
Presidio é um motor de código aberto para detecção de dados pessoais, desenvolvido pela Microsoft. É amplamente usado em ferramentas de revisão documental. Testes com peças processuais e contratos atribuem-lhe uma taxa de precisão de 22,7 %.
A precisão mede com que frequência um resultado positivo está correto. A 22,7 %, cerca de 77 de cada 100 itens marcados são falsos positivos. Não são sensíveis por nenhum padrão aplicável.
Para e-discovery, o cálculo é direto. Um conjunto de 10.000 documentos processados a essa taxa terá milhares de marcações infundadas. A parte produtora enfrenta o mesmo risco que o réu em Schnitzer Steel: uma produção contestada, uma revisão judicial e possíveis sanções.
Esse número reflete o comportamento padrão do Presidio com conteúdo de escritório de advocacia. Nem todas as ferramentas de IA operam nesse nível. Mas esse motor é a opção de código aberto mais usada no setor.
A causa é estrutural. Os sistemas de NLP são treinados com texto geral. A linguagem jurídica é diferente. Usa termos técnicos, formatos de citação e convenções de redação que divergem dos dados de treinamento. Uma ferramenta que funciona bem em prontuários médicos pode ser muito menos eficaz em transcrições de depoimentos.
O que os Dados de Uso Revelam
Outro dado: 27,4 % do conteúdo de chatbots de IA é sensível, segundo análise independente do uso empresarial de IA.
Isso descreve o que os funcionários enviam durante tarefas normais. Não dados que pretendiam compartilhar — conteúdo incluído por hábito ou acidente. Advogados que usam IA para redigir cartas, revisar contratos ou resumir depoimentos enviam conteúdo sensível a servidores de IA como efeito colateral do trabalho normal.
Quase três em cada dez interações envolvem dados de clientes, comunicações privilegiadas ou estratégia de caso. Esse conteúdo chega aos servidores do fornecedor em forma utilizável, a menos que controles técnicos o interceptem primeiro.
Para escritórios avaliando seu risco com IA, 27,4 % não é um problema marginal. É a hipótese de base. Quase um terço do uso de IA em um escritório envolve conteúdo que precisa de proteção.
A Cadeia de Responsabilidade
Retenção excessiva e vazamentos de dados de IA criam caminhos de risco separados, mas ligados. Ambos começam com a mesma decisão: implantar uma ferramenta de IA sem avaliação adequada.
O caminho discovery: A IA marca conteúdo amplamente → o advogado confia no resultado sem revisar cada marcação → a produção tem retenções injustificadas → o adversário contesta → o tribunal revisa → sanções.
O caminho de vazamento de dados: O advogado usa IA para o caso → a IA recebe comunicações privilegiadas → o fornecedor sofre uma violação → os dados do cliente ficam expostos → seguem-se reclamações por negligência profissional.
O ponto de partida é o mesmo nos dois casos. Os escritórios implantam ferramentas de IA sem saber o que elas realmente fazem. Não há controles adequados para o trabalho.
Revisão Orientada à Precisão para Produções
Os tribunais fazem uma pergunta específica ao revisar marcações contestadas. Cada uma era respaldada por privilégio, uma norma de confidencialidade ou uma ordem judicial? Não perguntam se a ferramenta do produtor marcou o máximo possível.
Uma marcação sem base válida é uma violação do procedimento. Não importa se foi produzida por um humano ou por uma IA. A análise é marcação por marcação.
Para os advogados, isso significa que as ferramentas de revisão com IA devem ser avaliadas pela precisão — a parcela das marcações que são realmente privilegiadas. Não apenas pelo recall. Uma ferramenta com 90 % de recall e 22,7 % de precisão captura mais conteúdo sensível. Mas cria uma carga de revisão manual para 77,3 % de falsos alertas. Quando essa revisão não acontece, segue-se retenção excessiva sistemática.
Cada marcação em uma produção é uma afirmação implícita ao tribunal. Diz: este conteúdo está legitimamente retido. Após Schnitzer Steel, essa afirmação precisa se sustentar.
Para mais sobre como ferramentas de anonimização diferem da detecção padrão de dados pessoais, veja nosso guia sobre precisão de IA em revisão documental. Para contexto sobre registros de privilégio e ferramentas de IA, leia nosso artigo sobre privilégio advogado-cliente e IA.