Retour au blogTechnologie juridique

Après les fichiers Epstein : Pourquoi la mise en...

La publication des fichiers Epstein par le DOJ en décembre 2025 a révélé un échec critique de redaction...

March 5, 20267 min de lecture
document redactionPDF redaction failurelegal complianceWord redaction

L'échec de redaction de décembre 2025

Lorsque le Département de la Justice des États-Unis a publié les fichiers Epstein en décembre 2025, la couverture médiatique s'est rapidement déplacée du contenu des documents vers leurs redactions — et spécifiquement sur la facilité avec laquelle ces redactions pouvaient être contournées.

Le mécanisme était simple : le texte "redacté" à l'aide d'une surbrillance noire dans les fichiers PDF reste présent dans la couche de texte du PDF. Copiez la boîte noire dans un éditeur de texte, et le texte sous-jacent apparaît. La dissimulation visuelle n'était pas une suppression de texte. Les informations sensibles n'ont jamais été supprimées.

Ce n'était pas une vulnérabilité nouvelle. L'affaire Anthony Pellicano de 2007 impliquait des informations sensibles révélées par une redaction inappropriée dans des documents juridiques. Le même mode d'échec était apparu dans des dépôts judiciaires, des rapports gouvernementaux et des productions de documents d'entreprise au cours des années intermédiaires. Pourtant, les fichiers Epstein, en raison de leur profil, ont rendu l'échec visible à des dizaines de millions de personnes qui ont suivi l'histoire se dérouler en temps réel.

Dissimulation visuelle vs. véritable redaction

Comprendre pourquoi cela continue à se produire nécessite de comprendre la distinction technique entre dissimulation et suppression.

La dissimulation visuelle place un élément visuel sur le texte sans retirer le texte de la structure du fichier. Les méthodes qui entrent dans cette catégorie :

  • Surbrillance de texte noire (met le fond du texte en noir)
  • Texte blanc sur fond blanc (change la couleur du texte pour correspondre au fond)
  • Dessin d'une forme rectangulaire noire sur le texte
  • Couverture d'annotation PDF (ajoute un élément d'annotation opaque)
  • Superposition d'image (place une image noire sur le texte)

Dans chaque cas ci-dessus, le texte original reste dans le fichier. Il peut être récupéré en copiant la région dissimulée, en retirant l'élément de superposition ou en examinant la structure brute du fichier.

La véritable redaction supprime le texte sous-jacent du fichier de manière permanente. Le texte n'est pas caché — il est parti. Il ne reste rien à récupérer.

La question cruciale pour tout document qui quitte votre contrôle est : lorsque quelqu'un ayant des connaissances techniques examine ce fichier, trouvera-t-il le texte original ? Avec la dissimulation visuelle, la réponse est oui.

Le problème des documents Word

Le même mode d'échec existe dans Microsoft Word. Utiliser la surbrillance de texte noire, la couleur de texte blanche ou des zones de texte opaques pour "redacter" un document Word laisse le texte original intact dans la structure XML du document.

Cela est important car les documents Word sont le format principal pour la correspondance juridique, les contrats, les déclarations de témoins, les fichiers RH et les enquêtes internes. Les organisations qui ont redigé des documents Word en utilisant des surbrillances ont produit des documents avec du contenu récupérable tout au long de l'historique de distribution de ces documents.

71 % des équipes juridiques utilisent des outils d'IA générative malgré des préoccupations concernant la résidence des données (ACC 2025). À mesure que les outils d'IA deviennent partie intégrante des flux de travail documentaires, le risque de découvrir des échecs de redaction passés augmente — les outils d'IA qui traitent des documents peuvent faire ressortir du texte provenant de sections "redactées" qui n'ont pas été réellement supprimées.

Exemples de haute visibilité d'échecs de redaction

Les fichiers Epstein n'étaient pas le premier exemple de haute visibilité de ce mode d'échec.

L'affaire Anthony Pellicano (2007) impliquait des informations sensibles révélées par des documents juridiques mal redigés déposés devant un tribunal fédéral.

Les documents de la NSA publiés par le biais de demandes FOIA ont été à plusieurs reprises trouvés contenant du texte lisible sous des boîtes noires en raison d'échecs de redaction PDF — un problème documenté par des chercheurs en sécurité et des journalistes analysant les publications de documents de sécurité nationale.

Les dépôts de litiges d'entreprise contiennent régulièrement du contenu redigé lisible par inadvertance lorsque les parties déposantes utilisent des couches de commentaires ou d'annotation PDF plutôt qu'une véritable suppression de contenu.

La cohérence de ce modèle d'échec reflète un écart fondamental entre la manière dont les professionnels du droit conceptualisent la redaction (comme un acte visuel) et la façon dont les formats de documents PDF et Word fonctionnent réellement (comme des données structurées contenant du texte indépendamment de la présentation visuelle).

Ce que nécessite une véritable redaction

Pour qu'un document soit véritablement redigé — de sorte qu'un destinataire techniquement capable ne puisse pas récupérer le contenu original — le texte sous-jacent doit être retiré de la structure du fichier et remplacé.

Dans les documents PDF, la véritable redaction nécessite :

  • Aplatir le PDF pour supprimer toutes les couches éditables
  • Remplacer le contenu textuel par des rectangles noirs ou des marqueurs de redaction au niveau du flux de contenu
  • Supprimer les métadonnées qui peuvent contenir le texte original
  • Supprimer les polices intégrées qui pourraient permettre la reconstruction du texte

Dans les documents Word, la véritable redaction nécessite :

  • Trouver chaque instance du texte à retirer (y compris dans les modifications suivies, les commentaires, l'historique des révisions, les métadonnées et les objets intégrés)
  • Remplacer le contenu textuel, sans le superposer visuellement
  • Préserver la mise en forme du document sans laisser d'artefacts indiquant ce qui a été retiré

Le mot clé est remplacement : le texte original doit être remplacé par autre chose, pas dissimulé sous autre chose.

Le problème des en-têtes, pieds de page et commentaires

La redaction de documents juridiques a une complexité supplémentaire au-delà du corps principal du texte. Les informations sensibles apparaissent dans des emplacements que les outils de redaction visuelle manquent souvent complètement :

Les en-têtes et pieds de page contiennent fréquemment des noms de matières, des identifiants de clients, des désignations confidentielles et des numéros de contrôle de documents. Surbriller en noir le corps d'un contrat tout en laissant "Privilégié et Confidentiel — Re : TechCorp/MegaStartup Acquisition" dans l'en-tête contredit l'objectif de l'exercice.

Les commentaires et les modifications suivies sont une source constante de divulgation involontaire. Un examinateur qui commente "voir le témoignage de John Smith à propos de cette clause" laisse ce commentaire dans le document même après que la clause elle-même soit "redactée."

Les propriétés du document et les métadonnées contiennent des noms d'auteurs, des noms d'entreprises, l'historique des révisions et des informations de résumé qui peuvent identifier l'origine du document même lorsque le contenu est redigé.

L'historique des révisions dans les documents Word préserve les versions précédentes du texte modifié. Un document qui disait "l'adresse du plaignant est 123 Main Street" et qui a ensuite été modifié en "l'adresse du plaignant" conserve la version originale dans l'historique des révisions à moins que cet historique ne soit explicitement effacé.

Construire un processus de redaction conforme

Étant donné les modes d'échec ci-dessus, un processus de redaction conforme nécessite :

1. Utiliser l'intégration native de Word pour les documents Word : La redaction qui fonctionne au sein du modèle d'objet de document Word — remplaçant directement le contenu textuel dans la structure du document — est la seule approche qui évite le problème de dissimulation vs. suppression. Convertir en PDF et rediger le PDF introduit un risque de transformation de format et peut ne pas gérer correctement les commentaires, les modifications suivies ou l'historique des révisions.

2. Traiter toutes les zones du document : Tout processus de redaction conforme doit inclure un traitement explicite des en-têtes, pieds de page, notes de bas de page, notes de fin, commentaires, modifications suivies et propriétés du document — pas seulement le texte du corps principal.

3. Vérifier la sortie : Après la redaction, vérifiez le résultat en tentant de récupérer le contenu redigé. Copiez-collez les zones redigées. Ouvrez la structure XML du document. Vérifiez les modifications suivies et l'historique des révisions. Si le contenu original apparaît quelque part, la redaction est incomplète.

4. Maintenir une piste d'audit : Pour les productions juridiques, documentez ce qui a été redigé, par quelle méthode et par qui. Cela devient pertinent si un litige sur le privilège ou un défi de redaction survient.

Les fichiers Epstein comme moment d'enseignement

L'échec de redaction des fichiers Epstein était embarrassant pour le DOJ, mais il fournit une démonstration concrète et publiquement visible de ce qui se passe exactement lorsque la dissimulation visuelle est confondue avec la véritable redaction.

Chaque équipe juridique, agence gouvernementale et professionnel de la conformité qui a suivi l'histoire devrait se demander : que contient l'historique des productions documentaires de notre organisation qui pourrait être récupéré de manière similaire ? Quel est notre processus de redaction actuel, et supprime-t-il réellement le texte ou le dissimule-t-il simplement ?

Les réponses à ces questions déterminent l'exposition réelle, et non l'existence d'une politique de redaction.


L'add-in Office d'anonym.legal effectue un véritable remplacement de PII dans les documents Word — remplaçant directement le contenu textuel dans la structure du document, sans le superposer visuellement. Les en-têtes, pieds de page, notes de bas de page, commentaires et modifications suivies sont traités. Le résultat est un document dont le texte original est absent, et non caché.

Sources :

Prêt à protéger vos données ?

Commencez à anonymiser les PII avec plus de 285 types d'entités dans 48 langues.