anonym.legal

By · Last updated 2026-06-05

Назад к блогуЮридические технологии

Ловушка PDF-редактирования: данные под угрозой

Дела Эпштейна в Министерстве юстиции, дело Манафорта и утечки АНБ объединяет одна и та же ошибка: косметическое зачёркивание, за которым базовый текст остаётся доступным для извлечения.

June 5, 20268 мин чтения
PDF redactionlegal redactioncourt filingFOIAdocument security

Самое опасное слово в защите юридических документов

Руководство обновлено для 2026 года.

Когда в судебном документе написано «REDACTED», люди предполагают, что скрытый текст исчез. Иногда — нет. Любой может скопировать и вставить закрашенный фрагмент и прочитать его за секунды. Этот изъян называется косметическим зачёркиванием. И он уже нанёс реальный ущерб.

Три случая доказывают, что риск не гипотетический.

Документы Министерства юстиции по делу Эпштейна (декабрь 2025). Судебные документы были поданы с чёрными полосами поверх имён. Текст под ними читался через копирование и вставку. Журналисты обнаружили это в течение нескольких часов. Имена, которые прокуратура добивалась сохранить в тайне, оказались раскрыты.

Дело Пола Манафорта (январь 2019). Адвокаты защиты подали документы по делу Мюллера, используя функцию выделения в Microsoft Word. Этот инструмент рисует чёрную полосу, но оставляет слова нетронутыми. Простая вставка текста раскрыла всё. Суд был недоволен.

Утечки АНБ (на протяжении нескольких лет). Десятилетия PDF-публикаций содержали извлекаемый текст. Журналисты и исследователи выявляли это раз за разом. Совет по надзору разведывательного сообщества выпустил официальные рекомендации именно по этому изъяну.

Каждый раз схема одна и та же. Кто-то накладывает визуальную полосу. Подаёт файл. Скрытый текст всплывает. Иногда — через несколько часов. Иногда — через годы.

Почему одних чёрных полос недостаточно

PDF состоит из трёх отдельных слоёв.

Слой содержимого хранит все символы, координаты и шрифты. Именно отсюда читают инструменты копирования и извлечения. Слой отображения содержит визуальные инструкции: фигуры, цвета, изображения и чёрные прямоугольники, используемые как накладные полосы. Слой метаданных хранит свойства файла: имя автора, временны́е метки и историю правок.

Косметическая полоса существует только в слое отображения. Слой содержимого под ней не тронут. «Выделить всё → Копировать → Вставить» вернёт каждое слово — включая те, что «скрыты» полосой.

Инструменты, создающие только визуальные полосы

Некоторые распространённые инструменты лишь закрашивают текст, не удаляя его.

Инструменты рисования Adobe Acrobat. Нарисовать прямоугольник — это не то же самое, что воспользоваться функцией «Редактировать». Прямоугольник существует только визуально.

Отслеживание изменений Microsoft Word. Удалённые фрагменты сохраняются в истории версий даже после принятия правок. История по-прежнему читаема.

PDF-аннотаторы браузеров. Они добавляют чёрное выделение, но не изменяют базовые данные.

Наложение изображений на отсканированные страницы. Безопасно только при условии, что слой исходного текста был предварительно удалён. Без этого шага сохранённый текст остаётся нетронутым.

Что требует настоящее редактирование

Подлинное редактирование удаляет информацию из слоя содержимого. После этого слой отображения просто не получает данных для показа. Успех подтверждается извлечением текста из сохранённого файла с проверкой отсутствия целевого фрагмента.

Судебные подразделения и спецслужбы следуют следующей процедуре:

  1. Использовать инструмент, работающий со слоем содержимого. Не использовать инструмент рисования или аннотирования.
  2. Экспортировать в новый PDF. Не перезаписывать оригинал.
  3. Открыть новый файл в чистом просмотрщике, не связанном с оригиналом.
  4. «Выделить всё → Копировать → Вставить» в текстовый редактор.
  5. Найти любой фрагмент скрытого абзаца.
  6. Найдено? Файл не обработан должным образом. Начните заново с правильным инструментом.
  7. Не найдено? Переходите к проверке метаданных.

Пятый шаг — ключевой тест. Визуальные наложения его провалят каждый раз. Правильно обработанный файл его пройдёт.

Проблема метаданных

Слой содержимого — не единственный путь утечки. Метаданные файла могут раскрыть многое.

Имя автора. Как правило, это адвокат или менеджер по делу, создавший документ.

Организация. Название юридической фирмы или ведомства.

Более ранние версии. Они показывают документ до внесения каких-либо изменений.

История правок. Здесь хранятся отслеживаемые изменения и комментарии.

Встроенные миниатюры. Они могут отображать документ в исходном, необработанном виде.

Руководство АНБ прямо указывает на это. «Уверенное редактирование требует также контроля над метаданными».

Для судебных документов это реальная проблема. Документ, поданный от имени анонимного лица, может содержать метаданные с именем реального автора. Версия с зачёркиванием может нести миниатюру оригинала. Надлежащие инструменты очищают метаданные в процессе обработки. Инструменты визуального наложения их не трогают.

Правовые последствия

Последствия зависят от контекста. Прецеденты неблагоприятны для всех, кто использует только визуальные наложения.

Федеральные суды. Правило 5.2(e) Федеральных правил гражданского судопроизводства требует удаления определённых идентификаторов из поданных документов. За нарушения суды назначали штрафы, запреты на подачу документов и направляли дела в адвокатские палаты.

Споры по FOIA. Ведомства, применяющие визуальные наложения поверх защищённой информации, могут столкнуться с тем, что эта информация будет извлечена. Суды выносили решения о раскрытии в подобных случаях.

Национальная безопасность. Сотрудники, упомянутые в утечках, несут задокументированные риски безопасности. Ущерб выходит за рамки репутационных потерь.

GDPR и HIPAA. Извлекаемые персональные данные образуют подлежащее уведомлению нарушение. Применяются статья 33 GDPR и Правило об уведомлении об утечках HIPAA.

Пятиминутная проверка перед подачей документа

Этот чек-лист полностью устраняет риск визуального наложения. На один документ уходит менее пяти минут.

  1. Используйте инструмент, работающий со слоем содержимого. Не используйте инструмент рисования или аннотирования.
  2. Экспортируйте в новый PDF. Не перезаписывайте оригинал.
  3. Откройте новый файл в чистом просмотрщике.
  4. «Выделить всё → Копировать → Вставить» в текстовый редактор.
  5. Найдите известную фразу из скрытого фрагмента.
  6. Найдена? Начните заново с правильным инструментом.
  7. Проверьте свойства PDF: автор, создатель, тема, ключевые слова.
  8. Проверьте наличие встроенных миниатюр, показывающих документ до обработки.
  9. Подайте проверенный документ.

Пять минут здесь обойдутся значительно дешевле, чем защита по ходатайству о несостоявшемся редактировании перед федеральным судьёй.

См. также: Объяснение провала с редактированием документов Эпштейна — подробный разбор инцидента декабря 2025 года.

См. также: Утечки персональных данных в рабочих окружениях через ИИ-ассистентов для написания кода — иной канал утечки, тот же урок.

anonym.legal предоставляет автоматизированную проверку текстового слоя для организаций, работающих с конфиденциальными документами.

Источники

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.