Nejnebezpečnější slovo v zabezpečení právních dokumentů: „Redigováno”
Když je soudní podání označeno razítkem „REDIGOVÁNO”, protistrana, novináři i veřejnost předpokládají, že informace jsou pryč. Když je tento předpoklad mylný — když lze „redigovaný” text extrahovat pomocí kopírování a vkládání nebo extrakcí textové vrstvy PDF — sahají důsledky od odborných sankcí až po ohrožení národní bezpečnosti.
Kosmetické redigování — překrývání PDFs vizuálními vrstvami bez odstranění podkladového textu — způsobilo řadu velmi sledovaných selhání, která dokládají, že nejde o hypotetické riziko.
Spisy DOJ v kauze Epstein (prosinec 2025): Soudní dokumenty podané s černými obdélníky přes citlivý text. Podkladový text byl extrahovatelný kopírováním a vkládáním. Novináři a veřejnost to zjistili v řádu hodin od podání. Únik zahrnoval jména a podrobnosti, o jejichž utajení federální žalobci usilovali.
Kauza Paul Manafort (leden 2019): Obhajoba podala redigované soudní dokumenty v Muellerově vyšetřování pomocí funkce zvýraznění textu ve Wordu — ta vytváří vizuální černý pruh, aniž odstraní podkladový text. Obsah se okamžitě odhalil kopírováním a vkládáním. Soud to nijak nezamlouvalo.
NSA a dokumenty zpravodajské komunity (opakované incidenty): Desetiletí „redigovaných” PDF vydání s extrahovatelným textem, opakovaně odhalovaných novináři a výzkumníky. Dohledový výbor zpravodajské komunity vydal k tomuto selhání již několik metodických pokynů.
Vzorec je konzistentní: někdo použije vizuální redigování, podá dokument v přesvědčení, že je zabezpečen, a podkladový text je objeven — někdy okamžitě, jindy až o léta později při opětovném přezkoumání dokumentů.
Jak kosmetické redigování funguje (a selhává)
Pochopení příčin selhání kosmetického redigování vyžaduje porozumět struktuře PDF.
Dokument PDF obsahuje několik vrstev:
Textová vrstva: Skutečný textový obsah uložený jako znaky se souřadnicemi, písmem a metadaty formátování. Tuto vrstvu zpřístupňují čtečky obrazovky, funkce kopírování a vkládání i nástroje pro extrakci textu.
Vrstva vykreslování: Instrukce pro vizuální zobrazení dokumentu — včetně obrázků, grafiky a barevných obdélníků (černé rámečky používané jako překryvné vrstvy redigování).
Vrstva metadat: Vlastnosti dokumentu, informace o autorovi, časová razítka vytvoření, historie revizí.
Kosmetické redigování přidá do vrstvy vykreslování obdélník vyplněný černou barvou. Obdélník vizuálně překryje text. Textová vrstva zůstane nezměněna. Kdokoli použije „Vybrat vše” → kopírovat → vložit do textového editoru, získá celý text, včetně textu „pod” černým obdélníkem.
Nástroje, které produkují kosmetické redigování:
- Kreslicí nástroje Adobe Acrobat (při kreslení obdélníků, nikoli při použití funkce Redigovat)
- Sledování změn v Microsoft Wordu (smazání v červeném textu, která jsou „přijata”, ale jejichž historie přetrvává v souboru)
- Vytvoření PDF na základě obrázků (bezpečné pouze v případě, že je textová vrstva odstraněna, nikoli pokud jsou obrázky přidány přes ni)
- Nástroje pro anotaci PDF v prohlížeči (přidání černého zvýraznění v prohlížečových prohlížečích PDF textovou vrstvu neupravuje)
Co skutečné redigování PDF vyžaduje
Skutečné redigování musí informace odstranit z textové vrstvy, nikoli jen z vrstvy vykreslování. Jediný způsob, jak ověřit, že redigování je skutečné, je extrahovat text z „redigovaného” dokumentu a potvrdit, že cílový obsah chybí.
Protokol ověření redigování používaný podatelenami soudů a programy vydávání dokumentů zpravodajské komunity:
- Použijte redigování pomocí nástrojů pro úpravu textové vrstvy
- Exportujte redigované PDF
- Spusťte extrakci textu z exportovaného PDF
- Potvrďte, že redigovaný obsah v extrahovaném textu chybí
- Zkontrolujte vrstvu metadat na zbytková data
- Odešlete ověřený dokument
Krok 3 je kritická kontrola, při níž kosmetické redigování selhává: extrakce textu z kosmeticky redigovaného PDF vrátí celý text. Extrakce textu z genuinně redigovaného PDF vrátí pro redigované oblasti prázdné řetězce nebo náhradní text.
Problém metadat
Kromě textové vrstvy vytváří metadata PDF sekundární způsob selhání redigování.
Metadata PDF mohou obsahovat:
- Jméno autora (osoba, která dokument vytvořila, zpravidla advokát nebo správce spisu)
- Název organizace (advokátní kancelář nebo státní úřad)
- Předchozí verze dokumentu zobrazující obsah před redigováním
- Historii revizí s komentáři nebo sledovanými změnami
- Vložené miniatury, které mohou ukazovat obsah dokumentu před redigováním
Pokyn NSA z roku 2015 „Redigování s jistotou” se metadatům věnuje výslovně: „Redigování s jistotou vyžaduje, aby byla rovněž kontrolována metadata.”
Pro soudní podání je riziko metadat značné: dokument zdánlivě anonymní strany může mít metadata odhalující totožnost autora. Redigovaný dokument může obsahovat vložené miniatury zobrazující původní verzi před redigováním.
Skutečné nástroje pro redigování odstraňují nebo dezinfikují metadata jako součást procesu redigování. Nástroje pro kosmetické redigování metadata zpravidla neupravují.
Právní důsledky selhání redigování
Odborné a právní důsledky selhání redigování závisejí na kontextu, ale precedent není pro ty, kdo se spoléhají na kosmetické redigování, příznivý:
Kontext federálního soudu: Pravidlo 5.2(e) Federálních procesních pravidel občanského soudního řízení vyžaduje, aby podané dokumenty byly redigovány z konkrétních osobních identifikátorů. Soudy ukládaly peněžní sankce, omezení podání a postoupení k disciplinárním orgánům advokátní komory za selhání redigování.
Kontext FOIA: Zákon o svobodě přístupu k informacím vyžaduje správné použití konkrétních výjimek z redigování. Úřady, které aplikovaly kosmetické redigování na obsah chráněný výjimkami FOIA, přičemž umožnily elektronickou extrakci tohoto obsahu, čelily úspěšným soudním sporům na základě FOIA požadujícím skutečné zpřístupnění.
Kontext zpravodajství a národní bezpečnosti: Kromě politické trapnosti zveřejněných zpravodajských operací čelí osoby identifikované prostřednictvím selhání redigování zvýšenému bezpečnostnímu riziku. Zákon o reformě zpravodajství a prevenci terorismu zavedl zvláštní odpovědnost za selhání v zabezpečení dokumentů.
Ochrana osobních údajů (GDPR/HIPAA): U osobních údajů je selhání redigování umožňující extrakci PII událostí narušení dat vyžadující oznámení podle čl. 33 GDPR a pravidla HIPAA pro oznamování narušení.
Sestavení protokolu ověření redigování
Pro jakoukoli organizaci podávající dokumenty s redigovanými informacemi eliminuje jednoduchý ověřovací protokol způsob selhání kosmetického redigování:
Kontrolní seznam před podáním:
- Aplikujte redigování pomocí nástroje pro úpravu textové vrstvy (nikoli anotace/překrytí)
- Exportujte do nového PDF
- Otevřete exportované PDF v novém prohlížeči bez přístupu k originálu
- Vybrat vše → Kopírovat → Vložit do prostého textového editoru
- Vyhledejte libovolnou část očekávaného redigovaného obsahu
- Pokud je nalezen: dokument NENÍ genuinně redigován — restartujte se správným nástrojem
- Pokud není nalezen: pokračujte kontrolou metadat
- Ve vlastnostech PDF zkontrolujte Autora, Tvůrce, Předmět, Klíčová slova na zbytková data
- Ověřený dokument je připraven k podání
Tento protokol trvá méně než 5 minut na dokument a poskytuje pozitivní ověření, že redigování je skutečné. Pro prostředí s vysokým objemem lze extrakci textu automatizovat jako dávkovou kontrolu před podáním.
Pět minut strávených ověřením skutečného redigování stojí méně než jedna minuta advokátního času při obhajobě selhání redigování před federálním soudcem.
Zdroje: