title: "Sanctions en e-discovery : quand la caviardage IA va trop loin" description: "Dans l'affaire Athletics Investment Group v. Schnitzer Steel (2024), un caviardage abusif a entraîné des sanctions en discovery. Avec une précision IA de 22,7 % seulement, les équipes juridiques font face à une responsabilité réelle." category: legal-tech publishedAt: 2026-03-12 tags:
- sanctions e-discovery
- responsabilité caviardage
- précision caviardage IA
- revue documentaire
- technologie juridique readingTime: 10
Mis à jour pour 2026
Deux façons dont le caviardage échoue
Les équipes juridiques font face à deux modes d'échec. Les deux créent une vraie responsabilité.
Le sous-caviardage expose des données privilégiées ou personnelles qui doivent rester cachées. La partie productrice divulgue du matériel qu'elle avait le droit — et souvent le devoir — de protéger.
Le sur-caviardage dissimule des faits que l'avocat adverse a le droit de consulter. Les tribunaux l'assimilent à une obstruction. Il s'agit d'une violation sanctionnable de la procédure.
Les outils IA qui privilégient le rappel à la précision créent le second problème par conception. Un moteur qui biffe 80 % d'un document pour ne rien manquer produit un résultat inutile. Il peut aussi entraîner des sanctions judiciaires.
Les deux modes d'échec mènent au même endroit : un juge, des explications et des coûts.
L'affaire Schnitzer Steel (2024)
L'affaire Athletics Investment Group v. Schnitzer Steel de 2024 illustre la réaction des tribunaux face à la rétention abusive de documents.
Une partie a produit des documents avec des marquages étendus. L'avocat adverse a contesté. Le tribunal a examiné les pièces. Il a constaté que les marquages dépassaient ce que la loi autorisait.
Résultat : des sanctions au titre de la Federal Rule of Civil Procedure 37. La partie productrice a supporté le coût d'un processus défaillant.
Ces sanctions ne sont pas nouvelles. Les tribunaux les appliquent depuis des années. Ce qui distingue cette affaire, c'est son calendrier. La revue assistée par IA est désormais courante en contentieux. L'affaire pose une question pratique : les équipes ont-elles vérifié la précision de leurs outils IA avant de les utiliser en production ?
La réponse compte. Un outil peu précis va marquer beaucoup trop. L'avocat qui s'y fie sans vérifier en porte le risque.
Pour une analyse détaillée, voir E-Discovery LLC sur l'interdiction des caviardages de pertinence.
Le problème de précision à 22,7 %
Presidio est un moteur open-source de détection des données personnelles, développé par Microsoft. Il est largement utilisé dans les outils de revue documentaire. Les tests sur des actes de procédure et des contrats lui donnent un taux de précision de 22,7 %.
La précision mesure la fréquence à laquelle un signal positif est correct. À 22,7 %, environ 77 des 100 éléments signalés sont de faux positifs. Ils ne sont sensibles selon aucun critère applicable.
Pour l'e-discovery, le calcul est direct. Un ensemble de 10 000 documents traités à ce taux contiendra des milliers de marquages non fondés. La partie productrice s'expose au même risque que le défendeur dans Schnitzer Steel : une production contestée, une révision judiciaire et des sanctions possibles.
Ce chiffre reflète le comportement par défaut de Presidio sur les contenus de cabinet. Tous les outils IA ne fonctionnent pas à ce niveau. Mais ce moteur est l'option open-source la plus déployée dans le secteur.
La cause est structurelle. Les systèmes NLP s'entraînent sur des textes généraux. Le langage judiciaire est différent. Il utilise des termes techniques, des formats de citation et des conventions de rédaction qui s'écartent des données d'entraînement. Un outil performant sur des dossiers médicaux peut être bien moins fiable sur des transcriptions de dépositions.
Ce que les données d'utilisation révèlent
Voici un second indicateur : 27,4 % du contenu des chatbots IA est sensible, selon une analyse indépendante des usages IA en entreprise.
Cela décrit ce que les employés soumettent lors de tâches ordinaires. Pas des données qu'ils voulaient partager — du contenu inclus par habitude ou par inadvertance. Les avocats utilisant l'IA pour rédiger des courriers, analyser des contrats ou résumer des dépositions envoient des informations sensibles à des serveurs IA comme effet secondaire de leur travail normal.
Près de trois interactions sur dix impliquent des données clients, des communications privilégiées ou une stratégie de dossier. Ce contenu atteint les serveurs du fournisseur IA sous forme utilisable, sauf si des contrôles techniques l'interceptent.
Pour les cabinets évaluant leur risque IA, 27,4 % n'est pas un problème marginal. C'est l'hypothèse de base. Près d'un tiers de l'utilisation de l'IA dans un cabinet implique du contenu qui nécessite protection.
La chaîne de responsabilité
La rétention excessive et les fuites de données IA créent des chemins de risque distincts mais liés. Tous deux commencent par la même décision : déployer un outil IA sans évaluation adéquate.
Le chemin discovery : L'IA signale largement → l'avocat se fie au résultat sans vérifier chaque marquage → la production contient des rétentions injustifiées → l'adversaire conteste → le tribunal examine → sanctions.
Le chemin fuite de données : L'avocat utilise l'IA pour son travail → l'IA reçoit des communications privilégiées → le fournisseur subit une violation → les données clients sont exposées → des réclamations pour faute professionnelle s'ensuivent.
Le point de départ est identique dans les deux cas. Les cabinets déploient des outils IA sans comprendre ce qu'ils font réellement. Aucun contrôle adapté n'est mis en place.
Revue orientée précision pour les productions
Les tribunaux posent une question précise lors de l'examen des marquages contestés. Chaque marquage était-il justifié par le privilège, une règle de confidentialité ou une ordonnance du tribunal ? Ils ne demandent pas si l'outil du producteur a signalé autant que possible.
Un marquage sans fondement valable constitue une violation de procédure. Peu importe si c'est un humain ou une IA qui l'a produit. L'examen se fait marquage par marquage.
Pour les avocats, cela signifie que les outils de revue IA doivent être évalués sur leur précision — la part des signaux qui sont réellement privilégiés. Pas seulement sur le rappel. Un outil à 90 % de rappel et 22,7 % de précision capte plus de contenu sensible. Mais il crée une charge de révision manuelle pour 77,3 % de faux signaux. Quand cette révision n'a pas lieu, une rétention systématique excessive suit.
Chaque marquage dans une production est une affirmation implicite au tribunal. Il dit : ce contenu est légitimement retenu. Après Schnitzer Steel, cette affirmation doit tenir.
Pour en savoir plus sur la différence entre les outils d'anonymisation et la détection standard des données personnelles, consultez notre guide sur la précision IA en revue documentaire. Pour le contexte sur les journaux de privilège et les outils IA, lisez notre article sur le secret professionnel et l'IA.