anonym.legal
Назад к блогуЮридические технологии

После файлов Эпштейна: почему черная обводка никогда...

Выпуск файлов Эпштейна Министерства юстиции США в декабре 2025 года выявил критическую ошибку в редактировании: текст, выделенный черным в PDF...

March 5, 20267 мин чтения
document redactionPDF redaction failurelegal complianceWord redaction

Ошибка редактирования декабря 2025 года

Когда Министерство юстиции США выпустило файлы Эпштейна в декабре 2025 года, внимание быстро переключилось с содержания документов на их редактирование — и, в частности, на то, как легко можно обойти эти редактирования.

Механизм был простым: текст, "редактированный" с помощью черного выделения в PDF-файлах, остается в текстовом слое PDF. Скопируйте черный прямоугольник в текстовый редактор, и исходный текст появится. Визуальное сокрытие не означало удаление текста. Чувствительная информация никогда не удалялась.

Это не была новая уязвимость. Дело Энтони Пелликано в 2007 году касалось чувствительной информации, раскрытой из-за неправильного редактирования в юридических документах. Та же ошибка наблюдалась в судебных документах, правительственных отчетах и корпоративных документах на протяжении всех этих лет. Тем не менее, файлы Эпштейна, благодаря своему профилю, сделали эту ошибку видимой для десятков миллионов людей, наблюдавших за развитием событий в реальном времени.

Визуальное сокрытие против истинной редакции

Чтобы понять, почему это продолжает происходить, необходимо осознать техническое различие между сокрытием и удалением.

Визуальное сокрытие накладывает визуальный элемент на текст, не удаляя текст из структуры файла. Методы, которые попадают в эту категорию:

  • Черное выделение текста (устанавливает черный фон для текста)
  • Белый текст на белом фоне (меняет цвет текста, чтобы он соответствовал фону)
  • Рисование черного прямоугольника поверх текста
  • Аннотация PDF, закрывающая текст (добавляет непрозрачный аннотированный элемент)
  • Наложение изображения (размещает черное изображение поверх текста)

В каждом из вышеуказанных случаев оригинальный текст остается в файле. Его можно восстановить, скопировав скрытую область, удалив наложенный элемент или изучив исходную структуру файла.

Истинная редакция навсегда удаляет исходный текст из файла. Текст не скрыт — он исчез. Ничего не остается для восстановления.

Критический вопрос для любого документа, который покидает ваш контроль: когда кто-то с техническими знаниями изучает этот файл, найдет ли он оригинальный текст? При визуальном сокрытии ответ — да.

Проблема документов Word

Та же ошибка существует и в Microsoft Word. Использование черного выделения текста, белого цвета текста или непрозрачных текстовых полей для "редактирования" документа Word оставляет оригинальный текст нетронутым в XML-структуре документа.

Это важно, потому что документы Word являются основным форматом для юридической переписки, контрактов, показаний свидетелей, кадровых файлов и внутренних расследований. Организации, которые редактировали документы Word с помощью выделения, производили документы с восстанавливаемым содержимым на протяжении всей истории распространения этих документов.

71% юридических команд используют инструменты генеративного ИИ несмотря на опасения по поводу резидентности данных (ACC 2025). Поскольку инструменты ИИ становятся частью рабочих процессов документов, риск обнаружения прошлых ошибок редактирования увеличивается — инструменты ИИ, обрабатывающие документы, могут выявить текст из "редактированных" разделов, которые на самом деле не были удалены.

Примеры высокопрофильных ошибок редактирования

Файлы Эпштейна не были первым высокопрофильным случаем этой ошибки.

Дело Энтони Пелликано (2007) касалось чувствительной информации, раскрытой через неправильно отредактированные юридические документы, поданные в федеральный суд.

Документы НСА, выпущенные по запросам FOIA, неоднократно обнаруживались с читаемым текстом под черными прямоугольниками из-за ошибок редактирования PDF — проблема, задокументированная исследователями безопасности и журналистами, анализирующими публикации документов национальной безопасности.

Корпоративные судебные документы регулярно содержат непреднамеренно читаемое отредактированное содержание, когда стороны, подающие документы, используют слои комментариев или аннотаций PDF вместо истинного удаления содержимого.

Согласованность этой модели ошибок отражает фундаментальный разрыв между тем, как юридические профессионалы концептуализируют редактирование (как визуальный акт), и тем, как форматы документов PDF и Word на самом деле работают (как структурированные данные, содержащие текст независимо от визуального представления).

Что требуется для истинной редакции

Чтобы документ был действительно отредактирован — так, чтобы технически способный получатель не мог восстановить оригинальное содержание — исходный текст должен быть удален из структуры файла и заменен.

В PDF-документах истинная редакция требует:

  • Упрощения PDF, чтобы удалить все редактируемые слои
  • Замены текстового содержимого черными прямоугольниками или маркерами редактирования на уровне потока содержимого
  • Удаления метаданных, которые могут содержать оригинальный текст
  • Удаления встроенных шрифтов, которые могут позволить восстановление текста

В документах Word истинная редакция требует:

  • Поиска каждого экземпляра текста, который необходимо удалить (включая отслеживаемые изменения, комментарии, историю ревизий, метаданные и встроенные объекты)
  • Замены текстового содержимого, а не наложения его визуально
  • Сохранения форматирования документа без оставления артефактов, указывающих на то, что было удалено

Ключевое слово — замена: оригинальный текст должен быть заменен чем-то другим, а не скрыт под чем-то другим.

Проблема заголовков, подвалов и комментариев

Редактирование юридических документов имеет дополнительную сложность помимо основного текста. Чувствительная информация появляется в местах, которые инструменты визуального редактирования часто полностью пропускают:

Заголовки и подзаголовки часто содержат названия дел, идентификаторы клиентов, конфиденциальные обозначения и номера контроля документов. Черное выделение тела контракта, оставляя "Привилегированный и конфиденциальный — по поводу приобретения TechCorp/MegaStartup" в заголовке, сводит на нет цель этого действия.

Комментарии и отслеживаемые изменения являются постоянным источником непреднамеренного раскрытия. Рецензент, который комментирует "см. показания Джона Смита по этому пункту", оставляет этот комментарий в документе даже после того, как сам пункт "редактируется."

Свойства документа и метаданные содержат имена авторов, названия компаний, историю ревизий и сводную информацию, которая может идентифицировать происхождение документа, даже когда содержание отредактировано.

История ревизий в документах Word сохраняет предыдущие версии редактированного текста. Документ, который говорил "домашний адрес истца — 123 Главная улица" и был затем отредактирован до "адрес истца", сохраняет оригинальную версию в истории ревизий, если эта история не была явно очищена.

Создание соответствующего процесса редактирования

Учитывая вышеуказанные ошибки, соответствующий процесс редактирования требует:

1. Используйте встроенную интеграцию Word для документов Word: редактирование, которое работает в рамках объектной модели документа Word — замена текстового содержимого непосредственно в структуре документа — это единственный подход, который избегает проблемы сокрытия и удаления. Конвертация в PDF и редактирование PDF вводит риск преобразования формата и может неправильно обрабатывать комментарии, отслеживаемые изменения или историю ревизий.

2. Обрабатывайте все зоны документа: любой соответствующий процесс редактирования должен включать явную обработку заголовков, подвалов, сносок, примечаний, отслеживаемых изменений и свойств документа — не только основного текста.

3. Проверьте результат: после редактирования проверьте результат, пытаясь восстановить отредактированное содержание. Скопируйте и вставьте отредактированные области. Откройте XML-структуру документа. Проверьте отслеживаемые изменения и историю ревизий. Если оригинальное содержание появляется где-либо, редактирование неполное.

4. Поддерживайте аудитный след: для юридических публикаций документируйте, что было отредактировано, каким методом и кем. Это становится актуальным, если возникает спор о привилегии или вызов редактирования.

Файлы Эпштейна как урок

Ошибка редактирования файлов Эпштейна была позорной для Министерства юстиции, но она предоставляет конкретную, публично видимую демонстрацию того, что происходит, когда визуальное сокрытие путается с истинной редакцией.

Каждая юридическая команда, государственное учреждение и специалист по соблюдению норм, которые наблюдали за развитием событий, должны задать вопрос: что находится в прошлых публикациях нашего учреждения, что могло бы быть аналогично восстановлено? Каков наш текущий процесс редактирования, и действительно ли он удаляет текст или просто скрывает его?

Ответы на эти вопросы определяют фактическое воздействие, а не наличие политики редактирования.


Office Add-in от anonym.legal выполняет истинную замену PII в документах Word — заменяя текстовое содержимое непосредственно в структуре документа, а не визуально накладывая его. Заголовки, подзаголовки, сноски, комментарии и отслеживаемые изменения обрабатываются. Результат — документ, из которого отсутствует оригинальный текст, а не скрыт.

Источники:

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.