anonym.legal
Назад до блогуЮридичні технології

Пастка редагування PDF: чому «чорна скринька» залишає...

Файли Епштейна DOJ, справа Манафорта та витоки NSA мають одне спільне: косметичне редагування, що залишає базовий текст витягуваним.

April 21, 20268 хв читання
PDF redactionlegal redactioncourt filingFOIAdocument security

Найнебезпечніше слово в безпеці юридичних документів: «відредаговано»

Коли судовий документ позначається «ВІДРЕДАГОВАНО», опонент, журналісти та громадськість припускають, що інформація зникла. Коли це припущення неправильне — коли «відредагований» текст можна витягти копіюванням-вставкою або витяганням текстового шару PDF — наслідки варіюються від професійних санкцій до розкриття інформації щодо національної безпеки.

Три режими невдалого редагування

Режим невдачі 1: Накладання зображення Чорна прямокутна форма накладається поверх тексту у програмному забезпеченні для редагування. Текст під прямокутником залишається в текстовому шарі PDF. Видалення прямокутника або витяг тексту з PDF розкриває відредагований вміст.

Реальний приклад: Файли Епштейна DOJ (2019). Чорні прямокутники накладено на тексти, що ідентифікують осіб. Текстовий шар витягнуто загальнодоступними інструментами в протягом годин після публічного оприлюднення.

Режим невдачі 2: Зміна кольору шрифту Текст змінюється до білого на білому тлі. Виглядає відредагованим при перегляді. Виявляється при виділенні-всього або пошуку.

Режим невдачі 3: Неповна растеризація Документ конвертується в зображення-PDF після редагування, але з нестандартним DPI або налаштуваннями, які дозволяють відновлення тексту через OCR із помилками.

Що є реальним редагуванням

Реальне редагування вимагає:

  1. Виявлення тексту: Ідентифікація PII у текстовому шарі PDF
  2. Видалення вмісту: Видалення символів або слів з текстового шару (не накладання)
  3. Растеризація (опціонально): Перетворення на растрове зображення видаляє всі текстові шари
  4. Перевірка: Спроба витягання тексту з відредагованого документа

Джерела:

Готові захистити свої дані?

Почніть анонімізувати PII з 285+ типами сутностей на 48 мовах.