Nejnebezpečnější slovo v zabezpečení právních dokumentů: „Redigováno”

Když je soudní podání označeno razítkem „REDIGOVÁNO”, protistrana, novináři i veřejnost předpokládají, že informace jsou pryč. Když je tento předpoklad mylný — když lze „redigovaný” text extrahovat pomocí kopírování a vkládání nebo extrakcí textové vrstvy PDF — sahají důsledky od odborných sankcí až po ohrožení národní bezpečnosti.

Kosmetické redigování — překrývání PDFs vizuálními vrstvami bez odstranění podkladového textu — způsobilo řadu velmi sledovaných selhání, která dokládají, že nejde o hypotetické riziko.

Spisy DOJ v kauze Epstein (prosinec 2025): Soudní dokumenty podané s černými obdélníky přes citlivý text. Podkladový text byl extrahovatelný kopírováním a vkládáním. Novináři a veřejnost to zjistili v řádu hodin od podání. Únik zahrnoval jména a podrobnosti, o jejichž utajení federální žalobci usilovali.

Kauza Paul Manafort (leden 2019): Obhajoba podala redigované soudní dokumenty v Muellerově vyšetřování pomocí funkce zvýraznění textu ve Wordu — ta vytváří vizuální černý pruh, aniž odstraní podkladový text. Obsah se okamžitě odhalil kopírováním a vkládáním. Soud to nijak nezamlouvalo.

NSA a dokumenty zpravodajské komunity (opakované incidenty): Desetiletí „redigovaných” PDF vydání s extrahovatelným textem, opakovaně odhalovaných novináři a výzkumníky. Dohledový výbor zpravodajské komunity vydal k tomuto selhání již několik metodických pokynů.

Vzorec je konzistentní: někdo použije vizuální redigování, podá dokument v přesvědčení, že je zabezpečen, a podkladový text je objeven — někdy okamžitě, jindy až o léta později při opětovném přezkoumání dokumentů.

Jak kosmetické redigování funguje (a selhává)

Pochopení příčin selhání kosmetického redigování vyžaduje porozumět struktuře PDF.

Dokument PDF obsahuje několik vrstev:

Textová vrstva: Skutečný textový obsah uložený jako znaky se souřadnicemi, písmem a metadaty formátování. Tuto vrstvu zpřístupňují čtečky obrazovky, funkce kopírování a vkládání i nástroje pro extrakci textu.

Vrstva vykreslování: Instrukce pro vizuální zobrazení dokumentu — včetně obrázků, grafiky a barevných obdélníků (černé rámečky používané jako překryvné vrstvy redigování).

Vrstva metadat: Vlastnosti dokumentu, informace o autorovi, časová razítka vytvoření, historie revizí.

Kosmetické redigování přidá do vrstvy vykreslování obdélník vyplněný černou barvou. Obdélník vizuálně překryje text. Textová vrstva zůstane nezměněna. Kdokoli použije „Vybrat vše” → kopírovat → vložit do textového editoru, získá celý text, včetně textu „pod” černým obdélníkem.

Nástroje, které produkují kosmetické redigování:

Kreslicí nástroje Adobe Acrobat (při kreslení obdélníků, nikoli při použití funkce Redigovat)
Sledování změn v Microsoft Wordu (smazání v červeném textu, která jsou „přijata”, ale jejichž historie přetrvává v souboru)
Vytvoření PDF na základě obrázků (bezpečné pouze v případě, že je textová vrstva odstraněna, nikoli pokud jsou obrázky přidány přes ni)
Nástroje pro anotaci PDF v prohlížeči (přidání černého zvýraznění v prohlížečových prohlížečích PDF textovou vrstvu neupravuje)

Co skutečné redigování PDF vyžaduje

Skutečné redigování musí informace odstranit z textové vrstvy, nikoli jen z vrstvy vykreslování. Jediný způsob, jak ověřit, že redigování je skutečné, je extrahovat text z „redigovaného” dokumentu a potvrdit, že cílový obsah chybí.

Protokol ověření redigování používaný podatelenami soudů a programy vydávání dokumentů zpravodajské komunity:

Použijte redigování pomocí nástrojů pro úpravu textové vrstvy
Exportujte redigované PDF
Spusťte extrakci textu z exportovaného PDF
Potvrďte, že redigovaný obsah v extrahovaném textu chybí
Zkontrolujte vrstvu metadat na zbytková data
Odešlete ověřený dokument

Krok 3 je kritická kontrola, při níž kosmetické redigování selhává: extrakce textu z kosmeticky redigovaného PDF vrátí celý text. Extrakce textu z genuinně redigovaného PDF vrátí pro redigované oblasti prázdné řetězce nebo náhradní text.

Problém metadat

Kromě textové vrstvy vytváří metadata PDF sekundární způsob selhání redigování.

Metadata PDF mohou obsahovat:

Jméno autora (osoba, která dokument vytvořila, zpravidla advokát nebo správce spisu)
Název organizace (advokátní kancelář nebo státní úřad)
Předchozí verze dokumentu zobrazující obsah před redigováním
Historii revizí s komentáři nebo sledovanými změnami
Vložené miniatury, které mohou ukazovat obsah dokumentu před redigováním

Pokyn NSA z roku 2015 „Redigování s jistotou” se metadatům věnuje výslovně: „Redigování s jistotou vyžaduje, aby byla rovněž kontrolována metadata.”

Pro soudní podání je riziko metadat značné: dokument zdánlivě anonymní strany může mít metadata odhalující totožnost autora. Redigovaný dokument může obsahovat vložené miniatury zobrazující původní verzi před redigováním.

Skutečné nástroje pro redigování odstraňují nebo dezinfikují metadata jako součást procesu redigování. Nástroje pro kosmetické redigování metadata zpravidla neupravují.

Právní důsledky selhání redigování

Odborné a právní důsledky selhání redigování závisejí na kontextu, ale precedent není pro ty, kdo se spoléhají na kosmetické redigování, příznivý:

Kontext federálního soudu: Pravidlo 5.2(e) Federálních procesních pravidel občanského soudního řízení vyžaduje, aby podané dokumenty byly redigovány z konkrétních osobních identifikátorů. Soudy ukládaly peněžní sankce, omezení podání a postoupení k disciplinárním orgánům advokátní komory za selhání redigování.

Kontext FOIA: Zákon o svobodě přístupu k informacím vyžaduje správné použití konkrétních výjimek z redigování. Úřady, které aplikovaly kosmetické redigování na obsah chráněný výjimkami FOIA, přičemž umožnily elektronickou extrakci tohoto obsahu, čelily úspěšným soudním sporům na základě FOIA požadujícím skutečné zpřístupnění.

Kontext zpravodajství a národní bezpečnosti: Kromě politické trapnosti zveřejněných zpravodajských operací čelí osoby identifikované prostřednictvím selhání redigování zvýšenému bezpečnostnímu riziku. Zákon o reformě zpravodajství a prevenci terorismu zavedl zvláštní odpovědnost za selhání v zabezpečení dokumentů.

Ochrana osobních údajů (GDPR/HIPAA): U osobních údajů je selhání redigování umožňující extrakci PII událostí narušení dat vyžadující oznámení podle čl. 33 GDPR a pravidla HIPAA pro oznamování narušení.

Sestavení protokolu ověření redigování

Pro jakoukoli organizaci podávající dokumenty s redigovanými informacemi eliminuje jednoduchý ověřovací protokol způsob selhání kosmetického redigování:

Kontrolní seznam před podáním:

Aplikujte redigování pomocí nástroje pro úpravu textové vrstvy (nikoli anotace/překrytí)
Exportujte do nového PDF
Otevřete exportované PDF v novém prohlížeči bez přístupu k originálu
Vybrat vše → Kopírovat → Vložit do prostého textového editoru
Vyhledejte libovolnou část očekávaného redigovaného obsahu
Pokud je nalezen: dokument NENÍ genuinně redigován — restartujte se správným nástrojem
Pokud není nalezen: pokračujte kontrolou metadat
Ve vlastnostech PDF zkontrolujte Autora, Tvůrce, Předmět, Klíčová slova na zbytková data
Ověřený dokument je připraven k podání

Tento protokol trvá méně než 5 minut na dokument a poskytuje pozitivní ověření, že redigování je skutečné. Pro prostředí s vysokým objemem lze extrakci textu automatizovat jako dávkovou kontrolu před podáním.

Pět minut strávených ověřením skutečného redigování stojí méně než jedna minuta advokátního času při obhajobě selhání redigování před federálním soudcem.

Zdroje:

Související články

Právní technologie

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.

Začít bezplatnou zkušební verzi Zobrazit funkce

Past PDF redigování: Data stále dostupná

Nejnebezpečnější slovo v zabezpečení právních dokumentů: „Redigováno”

Jak kosmetické redigování funguje (a selhává)

Co skutečné redigování PDF vyžaduje

Problém metadat

Právní důsledky selhání redigování

Sestavení protokolu ověření redigování

Související články

Legal PII: Privilege Detection

PII Detection Cuts E-Discovery Costs

Anonymous HR Surveys with Reversible PII

Připraveni chránit svá data?

Past PDF redigování: Data stále dostupná

Nejnebezpečnější slovo v zabezpečení právních dokumentů: „Redigováno”

Jak kosmetické redigování funguje (a selhává)

Co skutečné redigování PDF vyžaduje

Problém metadat

Právní důsledky selhání redigování

Sestavení protokolu ověření redigování

Související články

Legal PII: Privilege Detection

PII Detection Cuts E-Discovery Costs

Anonymous HR Surveys with Reversible PII

Připraveni chránit svá data?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow