Найнебезпечніше слово в безпеці юридичних документів: «відредаговано»
Коли судовий документ позначається «ВІДРЕДАГОВАНО», опонент, журналісти та громадськість припускають, що інформація зникла. Коли це припущення неправильне — коли «відредагований» текст можна витягти копіюванням-вставкою або витяганням текстового шару PDF — наслідки варіюються від професійних санкцій до розкриття інформації щодо національної безпеки.
Три режими невдалого редагування
Режим невдачі 1: Накладання зображення Чорна прямокутна форма накладається поверх тексту у програмному забезпеченні для редагування. Текст під прямокутником залишається в текстовому шарі PDF. Видалення прямокутника або витяг тексту з PDF розкриває відредагований вміст.
Реальний приклад: Файли Епштейна DOJ (2019). Чорні прямокутники накладено на тексти, що ідентифікують осіб. Текстовий шар витягнуто загальнодоступними інструментами в протягом годин після публічного оприлюднення.
Режим невдачі 2: Зміна кольору шрифту Текст змінюється до білого на білому тлі. Виглядає відредагованим при перегляді. Виявляється при виділенні-всього або пошуку.
Режим невдачі 3: Неповна растеризація Документ конвертується в зображення-PDF після редагування, але з нестандартним DPI або налаштуваннями, які дозволяють відновлення тексту через OCR із помилками.
Що є реальним редагуванням
Реальне редагування вимагає:
- Виявлення тексту: Ідентифікація PII у текстовому шарі PDF
- Видалення вмісту: Видалення символів або слів з текстового шару (не накладання)
- Растеризація (опціонально): Перетворення на растрове зображення видаляє всі текстові шари
- Перевірка: Спроба витягання тексту з відредагованого документа
Джерела: