By · Last updated 2026-03-05

Zpět na blogPrávní technologie

Epsteinovy spisy: Zvýraznění není anonymizace

Zveřejnění Epsteinových spisů ministerstvem spravedlnosti v prosinci 2025 odhalilo kritické pochybení při anonymizaci: text začerněný zvýrazněním v PDF zůstává čitelný pomocí kopírování a vložení.

March 5, 20267 min čtení
document redactionPDF redaction failurelegal complianceWord redaction

Selhání anonymizace v prosinci 2025

Aktualizováno pro rok 2026

Americké ministerstvo spravedlnosti zveřejnilo Epsteinovy spisy v prosinci 2025. Mediální pozornost se rychle přesunula od obsahu k anonymizaci — konkrétně k tomu, jak snadno lze tato opatření obejít.

Metoda byla prostá. „Anonymizovaný” obsah v PDF souborech byl začerněn zvýrazněním. Slova však v textové vrstvě PDF zůstávají. Zkopírujte černý obdélník do textového editoru a původní slova se objeví. Vizuální překrytí nebylo skutečným smazáním. Citlivá data nebyla nikdy odstraněna.

Nešlo o nový nedostatek. Již v případu Anthonyho Pellicana z roku 2007 došlo k odhalení citlivých dat prostřednictvím nesprávné anonymizace v soudních dokumentech. Stejné selhání se objevovalo v soudních podáních a vládních zprávách po léta. Epsteinovy spisy však toto selhání demonstrovaly v reálném čase před desítkami milionů lidí.

Více o de-identifikaci dokumentů v právním kontextu najdete v našem přehledu souladu s předpisy.

Vizuální překrytí versus skutečná anonymizace

Proč se to stále opakuje? Odpověď spočívá v klíčovém technickém rozdílu. Existuje rozdíl mezi vizuálním překrytím a skutečným smazáním.

Vizuální překrytí umisťuje prvek přes slova. Tato slova ze souboru neodstráňuje. Do této kategorie spadají všechny následující metody: černé zvýraznění nastaví pozadí na černou barvu; bílá slova na bílé stránce změní barvu tak, aby splynula; černý obdélník nakreslený přes text skryje pohled; anotační vrstva PDF přidá neprůhlednou vrstvu; překrytí obrázkem umístí černý obraz přes slova.

Ve všech případech původní slova v souboru zůstávají. Lze je najít zkopírováním dané oblasti nebo odstraněním překrytí. Technicky zdatný uživatel může prohledat i nezpracovaný soubor.

Skutečná anonymizace slova ze souboru trvale odstraní. Obsah není skrytý — je pryč. Nezůstane nic, co by bylo možné najít.

Klíčová otázka pro jakýkoli soubor, který odesíláte: když si jej někdo prověří, nalezne původní slova? U vizuálního překrytí je odpověď ano. Definice pojmů týkajících se anonymizace najdete v našem glosáři.

Problém s dokumenty Word

Stejné selhání existuje v aplikaci Microsoft Word. Použití černého zvýraznění nebo neprůhledných rámečků k „anonymizaci” souboru Word ponechá původní slova v XML dokumentu.

To je důležité, protože Word je hlavním formátem pro právní dopisy, smlouvy, personální spisy a interní přezkumy. Organizace používající zvýraznění odesílaly po celou dobu své existence záznamy s daty, která lze odhalit.

71 % právních týmů používá AI nástroje navzdory obavám o ukládání informací (průzkum ACC 2025). Jak AI nástroje vstupují do práce s dokumenty, roste riziko odhalení historických selhání anonymizace. AI, která čte vaše soubory, může najít slova v „anonymizovaných” částech, která nebyla nikdy skutečně smazána.

Vysoce profilovaná selhání anonymizace

Epsteinovy spisy nebyly prvním vysoce profilovaným případem tohoto selhání.

Případ Anthonyho Pellicana (2007) zahrnoval odhalení citlivých dat prostřednictvím nesprávně anonymizovaných dokumentů podaných k federálnímu soudu. [OVĚŘENO-EXTERNĚ]

Dokumenty NSA zveřejněné na základě žádostí FOIA opakovaně obsahovaly čitelná slova pod černými rámečky. Bezpečnostní výzkumníci to zdokumentovali v případech zveřejnění týkajících se národní bezpečnosti. [OVĚŘENO-EXTERNĚ]

Korporátní soudní podání často obsahují čitelný obsah, pokud strany místo skutečného smazání použijí anotační vrstvy PDF. [OVĚŘENO]

Tento vzorec ukazuje na základní mezeru. Právní týmy vnímají anonymizaci jako vizuální akt. Formáty PDF a Word však obsahují strukturovaná data bez ohledu na to, co vidíte na obrazovce.

Co skutečná anonymizace vyžaduje

Aby byl soubor skutečně anonymizován, musí být slova odstraněna a nahrazena. Kvalifikovaný odborník je nesmí být schopen obnovit.

V souborech PDF znamená skutečná anonymizace čtyři věci: sloučení PDF k odstranění všech editovatelných vrstev; nahrazení obsahu černými rámečky na úrovni proudu obsahu; odstranění metadat, která mohou obsahovat původní slova; a odstranění vložených písem, která by mohla umožnit obnovu.

V souborech Word znamená skutečná anonymizace tři věci: nalezení každého výskytu cílového obsahu — ve sledování změn, komentářích, metadatech a historii revizí; nahrazení obsahu, nikoli jeho vizuální překrytí; a zachování formátování bez zanechání stop.

Klíčovým slovem je nahrazení. Původní obsah musí být nahrazen něčím jiným, ne skryt pod něčím jiným.

Záhlaví, zápatí a skryté oblasti

Anonymizace právních dokumentů má více vrstev než jen hlavní text. Citlivá data se často vyskytují v oblastech, které vizuální nástroje zcela přehlédnou.

Záhlaví a zápatí často obsahují názvy věcí, identifikátory klientů a čísla dokumentů. Začernění těla smlouvy při ponechání textu „Privilegovaný — Věc: TechCorp” v záhlaví postrádá smysl.

Komentáře a sledování změn jsou běžným zdrojem neúmyslného zveřejnění. Recenzent, který napíše komentář „viz poznámka Jana Nováka”, tento komentář zanechá v souboru. Zůstane tam i po překrytí dané klauzule.

Vlastnosti dokumentu a metadata obsahují jména autorů a historii revizí. Ty mohou odhalit původ dokumentu i po začernění těla.

Historie revizí ve Wordu uchovává předchozí verze upraveného obsahu. Soubor, který dříve obsahoval větu „trvalé bydliště žalobce je Hlavní náměstí 123”, tuto verzi zachovává — dokud ji nevymažete.

Budování vyhovujícího postupu

S ohledem na tato selhání vyžaduje spolehlivý postup anonymizace čtyři kroky.

1. Používejte nativní integraci Word pro soubory Word. Anonymizace v objektovém modelu Wordu nahrazuje obsah přímo v souboru. Tím se vyhýbáte problému s překrytím. Předchozí převod do PDF přidává riziko a může přehlédnout komentáře a historii revizí.

2. Zpracovávejte všechny oblasti dokumentu. Vyhovující postup musí pokrývat záhlaví, zápatí, poznámky pod čarou, závěrečné poznámky, komentáře, sledování změn a vlastnosti dokumentu — nejen hlavní text.

3. Ověřte výstup. Po anonymizaci se pokuste obsah obnovit. Zkopírujte anonymizované oblasti. Zkontrolujte XML dokumentu. Přezkumte sledování změn a historii revizí. Pokud se původní obsah kdekoli objeví, anonymizace je neúplná.

4. Udržujte auditní stopu. Pro právní produkce zaznamenejte, co bylo anonymizováno, jakou metodou a kým. To je důležité, pokud vznikne spor o ochranu tajemství. Více informací najdete na naší stránce zabezpečení a souladu s předpisy.

Poučení z Epsteinových spisů

Selhání u Epsteinových spisů bylo veřejnou lekcí. Ukázalo, co se stane, když je vizuální překrytí zaměněno za skutečnou anonymizaci.

Každý právní tým a odborník na compliance, kdo tuto kauzu sledoval, by si měl položit dvě otázky: Co je v našich dřívějších dokumentárních produkcích, co by mohlo být podobně obnoveno? A odstraňuje náš současný postup obsah skutečně, nebo ho pouze zakrývá?

Odpovědi určují skutečnou míru rizika — ne jen existenci politiky anonymizace.


Doplněk anonym.legal pro Office provádí skutečné nahrazení osobních údajů přímo v souborech Word. Nahrazuje obsah přímo ve struktuře dokumentu, nikoli přes ni vizuálně. Jsou zpracována záhlaví, zápatí, poznámky pod čarou, komentáře i sledování změn. Výsledkem je soubor, z něhož původní data chybí — nejsou jen skryta. Zjistěte více.

Zdroje

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.