Selhání anonymizace v prosinci 2025
Aktualizováno pro rok 2026
Americké ministerstvo spravedlnosti zveřejnilo Epsteinovy spisy v prosinci 2025. Mediální pozornost se rychle přesunula od obsahu k anonymizaci — konkrétně k tomu, jak snadno lze tato opatření obejít.
Metoda byla prostá. „Anonymizovaný” obsah v PDF souborech byl začerněn zvýrazněním. Slova však v textové vrstvě PDF zůstávají. Zkopírujte černý obdélník do textového editoru a původní slova se objeví. Vizuální překrytí nebylo skutečným smazáním. Citlivá data nebyla nikdy odstraněna.
Nešlo o nový nedostatek. Již v případu Anthonyho Pellicana z roku 2007 došlo k odhalení citlivých dat prostřednictvím nesprávné anonymizace v soudních dokumentech. Stejné selhání se objevovalo v soudních podáních a vládních zprávách po léta. Epsteinovy spisy však toto selhání demonstrovaly v reálném čase před desítkami milionů lidí.
Více o de-identifikaci dokumentů v právním kontextu najdete v našem přehledu souladu s předpisy.
Vizuální překrytí versus skutečná anonymizace
Proč se to stále opakuje? Odpověď spočívá v klíčovém technickém rozdílu. Existuje rozdíl mezi vizuálním překrytím a skutečným smazáním.
Vizuální překrytí umisťuje prvek přes slova. Tato slova ze souboru neodstráňuje. Do této kategorie spadají všechny následující metody: černé zvýraznění nastaví pozadí na černou barvu; bílá slova na bílé stránce změní barvu tak, aby splynula; černý obdélník nakreslený přes text skryje pohled; anotační vrstva PDF přidá neprůhlednou vrstvu; překrytí obrázkem umístí černý obraz přes slova.
Ve všech případech původní slova v souboru zůstávají. Lze je najít zkopírováním dané oblasti nebo odstraněním překrytí. Technicky zdatný uživatel může prohledat i nezpracovaný soubor.
Skutečná anonymizace slova ze souboru trvale odstraní. Obsah není skrytý — je pryč. Nezůstane nic, co by bylo možné najít.
Klíčová otázka pro jakýkoli soubor, který odesíláte: když si jej někdo prověří, nalezne původní slova? U vizuálního překrytí je odpověď ano. Definice pojmů týkajících se anonymizace najdete v našem glosáři.
Problém s dokumenty Word
Stejné selhání existuje v aplikaci Microsoft Word. Použití černého zvýraznění nebo neprůhledných rámečků k „anonymizaci” souboru Word ponechá původní slova v XML dokumentu.
To je důležité, protože Word je hlavním formátem pro právní dopisy, smlouvy, personální spisy a interní přezkumy. Organizace používající zvýraznění odesílaly po celou dobu své existence záznamy s daty, která lze odhalit.
71 % právních týmů používá AI nástroje navzdory obavám o ukládání informací (průzkum ACC 2025). Jak AI nástroje vstupují do práce s dokumenty, roste riziko odhalení historických selhání anonymizace. AI, která čte vaše soubory, může najít slova v „anonymizovaných” částech, která nebyla nikdy skutečně smazána.
Vysoce profilovaná selhání anonymizace
Epsteinovy spisy nebyly prvním vysoce profilovaným případem tohoto selhání.
Případ Anthonyho Pellicana (2007) zahrnoval odhalení citlivých dat prostřednictvím nesprávně anonymizovaných dokumentů podaných k federálnímu soudu. [OVĚŘENO-EXTERNĚ]
Dokumenty NSA zveřejněné na základě žádostí FOIA opakovaně obsahovaly čitelná slova pod černými rámečky. Bezpečnostní výzkumníci to zdokumentovali v případech zveřejnění týkajících se národní bezpečnosti. [OVĚŘENO-EXTERNĚ]
Korporátní soudní podání často obsahují čitelný obsah, pokud strany místo skutečného smazání použijí anotační vrstvy PDF. [OVĚŘENO]
Tento vzorec ukazuje na základní mezeru. Právní týmy vnímají anonymizaci jako vizuální akt. Formáty PDF a Word však obsahují strukturovaná data bez ohledu na to, co vidíte na obrazovce.
Co skutečná anonymizace vyžaduje
Aby byl soubor skutečně anonymizován, musí být slova odstraněna a nahrazena. Kvalifikovaný odborník je nesmí být schopen obnovit.
V souborech PDF znamená skutečná anonymizace čtyři věci: sloučení PDF k odstranění všech editovatelných vrstev; nahrazení obsahu černými rámečky na úrovni proudu obsahu; odstranění metadat, která mohou obsahovat původní slova; a odstranění vložených písem, která by mohla umožnit obnovu.
V souborech Word znamená skutečná anonymizace tři věci: nalezení každého výskytu cílového obsahu — ve sledování změn, komentářích, metadatech a historii revizí; nahrazení obsahu, nikoli jeho vizuální překrytí; a zachování formátování bez zanechání stop.
Klíčovým slovem je nahrazení. Původní obsah musí být nahrazen něčím jiným, ne skryt pod něčím jiným.
Záhlaví, zápatí a skryté oblasti
Anonymizace právních dokumentů má více vrstev než jen hlavní text. Citlivá data se často vyskytují v oblastech, které vizuální nástroje zcela přehlédnou.
Záhlaví a zápatí často obsahují názvy věcí, identifikátory klientů a čísla dokumentů. Začernění těla smlouvy při ponechání textu „Privilegovaný — Věc: TechCorp” v záhlaví postrádá smysl.
Komentáře a sledování změn jsou běžným zdrojem neúmyslného zveřejnění. Recenzent, který napíše komentář „viz poznámka Jana Nováka”, tento komentář zanechá v souboru. Zůstane tam i po překrytí dané klauzule.
Vlastnosti dokumentu a metadata obsahují jména autorů a historii revizí. Ty mohou odhalit původ dokumentu i po začernění těla.
Historie revizí ve Wordu uchovává předchozí verze upraveného obsahu. Soubor, který dříve obsahoval větu „trvalé bydliště žalobce je Hlavní náměstí 123”, tuto verzi zachovává — dokud ji nevymažete.
Budování vyhovujícího postupu
S ohledem na tato selhání vyžaduje spolehlivý postup anonymizace čtyři kroky.
1. Používejte nativní integraci Word pro soubory Word. Anonymizace v objektovém modelu Wordu nahrazuje obsah přímo v souboru. Tím se vyhýbáte problému s překrytím. Předchozí převod do PDF přidává riziko a může přehlédnout komentáře a historii revizí.
2. Zpracovávejte všechny oblasti dokumentu. Vyhovující postup musí pokrývat záhlaví, zápatí, poznámky pod čarou, závěrečné poznámky, komentáře, sledování změn a vlastnosti dokumentu — nejen hlavní text.
3. Ověřte výstup. Po anonymizaci se pokuste obsah obnovit. Zkopírujte anonymizované oblasti. Zkontrolujte XML dokumentu. Přezkumte sledování změn a historii revizí. Pokud se původní obsah kdekoli objeví, anonymizace je neúplná.
4. Udržujte auditní stopu. Pro právní produkce zaznamenejte, co bylo anonymizováno, jakou metodou a kým. To je důležité, pokud vznikne spor o ochranu tajemství. Více informací najdete na naší stránce zabezpečení a souladu s předpisy.
Poučení z Epsteinových spisů
Selhání u Epsteinových spisů bylo veřejnou lekcí. Ukázalo, co se stane, když je vizuální překrytí zaměněno za skutečnou anonymizaci.
Každý právní tým a odborník na compliance, kdo tuto kauzu sledoval, by si měl položit dvě otázky: Co je v našich dřívějších dokumentárních produkcích, co by mohlo být podobně obnoveno? A odstraňuje náš současný postup obsah skutečně, nebo ho pouze zakrývá?
Odpovědi určují skutečnou míru rizika — ne jen existenci politiky anonymizace.
Doplněk anonym.legal pro Office provádí skutečné nahrazení osobních údajů přímo v souborech Word. Nahrazuje obsah přímo ve struktuře dokumentu, nikoli přes ni vizuálně. Jsou zpracována záhlaví, zápatí, poznámky pod čarou, komentáře i sledování změn. Výsledkem je soubor, z něhož původní data chybí — nejsou jen skryta. Zjistěte více.