By · Last updated 2026-03-05

Tornar al BlogTecnologia Legal

Arxius Epstein: ressaltar no es redactar

La publicacio dels arxius Epstein per part del DOJ el desembre del 2025 va exposar un error critic de redaccio: el text de PDF ressaltat en negre continua sent llegible mitjancant copia i enganxament.

March 5, 20267 min llegit
document redactionPDF redaction failurelegal complianceWord redaction

El fracas de redaccio del desembre del 2025

Actualitzat per al 2026

El Departament de Justicia dels EUA va publicar els arxius Epstein el desembre del 2025. La cobertura mediatica es va desplacar rapidament del contingut a les redaccions. Es va centrar en la facilitat amb que es podien eludir.

El metode era senzill. El contingut "redactat" als fitxers PDF estava tapat amb ressaltat negre. Pero les paraules continuen a la capa de text del PDF. Copieu el requadre negre en un editor de text i les paraules originals apareixen. La cobertura visual no era una eliminacio real. Les dades sensibles mai van ser eliminades.

Aixo no era un defecte nou. El cas Anthony Pellicano del 2007 va revelar dades sensibles a traves d'una redaccio incorrecta en documents judicials. El mateix error va apareixer en presentacions judicials i informes governamentals durant anys. Pero els arxius Epstein van fer visible el fracas a desenes de milions de persones en temps real.

Per obtenir mes informacio sobre la desidentificacio de documents en contextos juridics, vegeu el nostre resum de conformitat.

Cobertura visual vs. redaccio real

Per que continua passant aixo? La resposta rau en una bretxa tecnica clau. Hi ha una diferencia entre la cobertura visual i l'eliminacio real.

La cobertura visual col-loca un element sobre les paraules. No elimina les paraules del fitxer. Tots aquests metodes pertanyen a aquest grup. El ressaltat negre estableix el fons en negre. Les paraules blanques sobre una pagina blanca canvien el color per coincidir. Un rectangle negre dibuixat sobre el text amaga la vista. L'anotacio PDF de cobertura afegeix una capa opaca a sobre. Una superposicio d'imatge col-loca una imatge negra sobre les paraules.

En tots els casos, les paraules originals romanen al fitxer. Es poden trobar copiant la regio o eliminant la superposicio. Una persona amb coneixements tecnics tambe pot escanejar el fitxer brut.

La redaccio real elimina les paraules del fitxer per sempre. El contingut no esta amagat -- ha desaparegut. No queda res per trobar.

La pregunta clau per a qualsevol fitxer que envieu: quan algu comproveu aquest fitxer, trobara les paraules originals? Amb la cobertura visual, la resposta es si. Vegeu el nostre glossari per a definicions dels termes de redaccio.

El problema dels documents Word

El mateix error existeix a Microsoft Word. Utilitzar ressaltat negre o requadres opacs per "redactar" un fitxer Word deixa les paraules originals a l'XML del document.

Aixo importa perque Word es el format principal per a cartes juridiques, contractes, expedients de RRHH i revisions internes. Els grups que utilitzen ressaltat han estat enviant registres amb dades que es poden trobar al llarg de la seva historia.

El 71% dels equips juridics utilitzen eines d'IA malgrat les preocupacions sobre l'emmagatzematge d'informacio (enquesta ACC 2025). A mesura que les eines d'IA entren en el treball documental, el risc d'aflorar antics errors de redaccio creix. Una IA que llegeix els vostres fitxers pot trobar paraules en seccions "redactades" que mai van ser realment eliminades.

Casos d'alt perfil de errors de redaccio

Els arxius Epstein no van ser el primer cas d'alt perfil d'aquest fracas.

El cas Anthony Pellicano (2007) va implicar dades sensibles revelades a traves de documents incorrectament redactats presentats davant un tribunal federal. [VERIFICAT-EXTERN]

Els documents de la NSA publicats a traves de sol-licituds FOIA han tingut repetidament paraules llegibles sota requadres negres. Els investigadors de seguretat han documentat aixo en publicacions de seguretat nacional. [VERIFICAT-EXTERN]

Les presentacions de litigis corporatius sovint tenen contingut llegible quan les parts utilitzen capes d'anotacio PDF en comptes d'una eliminacio real. [VERIFICAT]

Aquest patro mostra una bretxa basica. Els equips juridics pensen en la redaccio com un acte visual. Pero els formats PDF i Word contenen dades estructurades independentment del que veieu a la pantalla.

Que necessita la redaccio real

Perque un fitxer estigui veritablement redactat, les paraules han de ser eliminades i reemplacades. Una persona qualificada no ha de poder recuperar-les.

En fitxers PDF, la redaccio real significa quatre coses. Primer, aplanar el PDF per eliminar totes les capes editables. Segon, reemplazar el contingut amb requadres negres al nivell del flux de contingut. Tercer, eliminar metadades que puguin contenir les paraules originals. Quart, eliminar les fonts incrustades que podrien permetre la recuperacio.

En fitxers Word, la redaccio real significa tres coses. Primer, trobar cada instancia del contingut objectiu -- en el seguiment de canvis, comentaris, metadades i historial de revisions. Segon, reemplazar el contingut, no cobrir-lo visualment. Tercer, preservar el format sense deixar marques.

La paraula clau es reemplacament. El contingut original ha de ser reemplaced per alguna altra cosa, no amagat sota alguna cosa.

Capcaleres, peus de pagina i zones ocultes

La redaccio de documents juridics te mes capes que nomes el cos principal. Les dades sensibles sovint apareixen en zones que les eines visuals passen per alt completament.

Les capcaleres i peus de pagina sovint contenen noms d'assumptes, ID de clients i numeros de documents. Enfosquir el cos d'un contracte mentre es deixa "Privilegiat -- Re: TechCorp" a la capcalera derrota el proposit.

Els comentaris i el seguiment de canvis son una font comuna de divulgacio no intencionada. Un revisor que comenta "vegeu la nota de John Smith" ho deixa al fitxer. Continua all despres de que la clausula quedi coberta.

Les propietats del document i metadades contenen noms d'autors i historial de revisions. Aixo pot revelar l'origen del document fins i tot quan el cos esta enfosquit.

L'historial de revisions a Word preserva versions anteriors del contingut editat. Un fitxer que un cop deia "l'adreca del demandant es Carrer Major 123" manté aquesta versio. Continua all menys que la netegeu.

Construir un proces compliant

Donats aquests modes de fallada, un bon proces de redaccio necessita quatre passos.

1. Utilitzeu la integracio nativa de Word per als fitxers Word. La redaccio dins del model d'objectes de Word reemplaca el contingut directament al fitxer. Aixo evita el problema del dissimulament. Convertir primer a PDF afegeix risc i pot perdre comentaris i historial de revisions.

2. Processar totes les zones del document. Un proces compliant ha de gestionar capcaleres, peus de pagina, notes a peu de pagina, notes finals, comentaris, seguiment de canvis i propietats del document -- no nomes el cos principal.

3. Verificar el resultat. Despres de la redaccio, intenteu recuperar el contingut. Copieu i enganxeu les arees redactades. Comproveu l'XML del document. Reviseu el seguiment de canvis i l'historial de revisions. Si el contingut original apareix en algun lloc, la redaccio es incompleta.

4. Mantenir un rastre d'auditoria. Per a produccions juridiques, registreu que es va redactar, amb quin metode i per qui. Aixo importa si sorgeix una disputa de privilegi. Obteniu mes informacio a la nostra pagina de seguretat i conformitat.

Llicons dels arxius Epstein

El fracas dels arxius Epstein va ser una llico publica. Va mostrar el que passa quan la cobertura visual es confon amb la redaccio real.

Tot equip juridic i professional de conformitat que va seguir aquesta historia hauria de fer-se dues preguntes. Primer, que hi ha a les nostres produccions documentals passades que podria ser recuperat de manera similar? Segon, el nostre proces actual elimina realment el contingut o simplement el cobreix?

Les respostes determinen l'exposicio real -- no la mera existencia d'una politica de redaccio.


El complement d'Office d'anonym.legal realitza el reemplacament real de dades personals dins dels fitxers Word. Reemplaca el contingut directament a l'estructura del document, no visualment per sobre d'ell. Les capcaleres, peus de pagina, notes a peu de pagina, comentaris i seguiment de canvis es processen tots. El resultat es un fitxer del qual les dades originals son absents, no amagades. Obteniu mes informacio.

Fonts

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.