anonym.legal

By · Last updated 2026-03-05

Назад до блогуЮридичні технології

Справа Епштейна: підсвічування — це не редагування

Публікація матеріалів Епштейна Міністерством юстиції у грудні 2025 року виявила критичну помилку редагування: текст, підсвічений чорним у PDF, залишається читабельним через копіювання та вставлення.

March 5, 20267 хв читання
document redactionPDF redaction failurelegal complianceWord redaction

Помилка редагування у грудні 2025 року

Оновлено у 2026 році

Міністерство юстиції США опублікувало матеріали Епштейна у грудні 2025 року. Медійне висвітлення швидко переключилося з вмісту на редагування — і на те, наскільки легко його можна обійти.

Метод був простим. «Відредагований» вміст у файлах PDF було приховано чорним підсвічуванням. Але слова залишаються в текстовому шарі PDF. Скопіюйте чорний блок до текстового редактора — і оригінальні слова з'являться. Візуальне прикриття не було справжнім видаленням. Конфіденційні дані так і не були усунуті.

Це була не нова вада. У справі Ентоні Пеллікано 2007 року конфіденційні дані стали відомими через неналежне редагування в юридичних документах. Та сама помилка з'являлася у судових документах і урядових звітах роками. Але справа Епштейна зробила її видимою для десятків мільйонів людей у режимі реального часу.

Для отримання додаткової інформації про деідентифікацію документів у юридичному контексті дивіться наш огляд відповідності.

Візуальне прикриття проти справжнього редагування

Чому це продовжує відбуватися? Відповідь криється в ключовій технічній прогалині. Є різниця між візуальним прикриттям і справжнім видаленням.

Візуальне прикриття розміщує елемент поверх слів. Воно не видаляє ці слова з файлу. Всі ці методи відносяться до цієї категорії: чорне підсвічування встановлює чорний фон; білі слова на білій сторінці змінюють колір, щоб він збігся; чорний прямокутник, намальований поверх тексту, приховує огляд; анотація PDF додає непрозорий шар зверху; накладений зображенням чорний малюнок розміщується поверх слів.

У кожному з цих випадків оригінальні слова залишаються у файлі. Їх можна знайти, скопіювавши область або видаливши накладення. Технічно підготовлена людина може також сканувати необроблений файл.

Справжнє редагування назавжди видаляє слова з файлу. Вміст не приховується — він зникає. Нічого не залишається для пошуку.

Ключове питання для будь-якого файлу, який ви надсилаєте: коли хтось перевірить цей файл, чи знайде він оригінальні слова? При візуальному прикритті відповідь — так. Дивіться наш глосарій для визначень термінів редагування.

Проблема документів Word

Та сама помилка існує у Microsoft Word. Використання чорного підсвічування або непрозорих блоків для «редагування» файлу Word залишає оригінальні слова в XML документа.

Це важливо, оскільки Word є основним форматом для юридичних листів, договорів, кадрових документів і внутрішніх перевірок. Організації, що використовували підсвічування, надсилали документи з даними, які можна знайти, протягом усієї своєї діяльності.

71% юридичних команд використовують інструменти ШІ незважаючи на проблеми зі зберіганням інформації (опитування ACC 2025). Оскільки інструменти ШІ входять у документообіг, зростає ризик виявлення минулих помилок редагування. ШІ, що зчитує ваші файли, може знайти слова в «відредагованих» розділах, які насправді ніколи не були видалені.

Гучні випадки помилок редагування

Справа Епштейна була не першим гучним випадком такої помилки.

Справа Ентоні Пеллікано (2007) — конфіденційні дані були розкриті через неналежно відредаговані документи, подані у федеральний суд. [VERIFIED-EXTERNAL]

Документи АНБ, оприлюднені за запитами FOIA, неодноразово мали читабельні слова під чорними блоками. Дослідники безпеки задокументували це у публікаціях щодо національної безпеки. [VERIFIED-EXTERNAL]

Документи корпоративних судових справ часто містять читабельний вміст, коли сторони використовують шари анотацій PDF замість справжнього видалення. [VERIFIED]

Цей зразок вказує на фундаментальну прогалину. Юридичні команди сприймають редагування як візуальну дію. Але формати PDF і Word містять структуровані дані незалежно від того, що ви бачите на екрані.

Що потрібне для справжнього редагування

Щоб файл був по-справжньому відредагований, слова повинні бути видалені і замінені. Кваліфікована особа не повинна мати змоги їх відновити.

У файлах PDF справжнє редагування означає чотири речі: по-перше, згладити PDF для видалення всіх редагованих шарів; по-друге, замінити вміст чорними блоками на рівні потоку вмісту; по-третє, видалити метадані, які можуть зберігати оригінальні слова; по-четверте, видалити вбудовані шрифти, які могли б дозволити відновлення.

У файлах Word справжнє редагування означає три речі: по-перше, знайти кожний екземпляр цільового вмісту — у відстежених змінах, коментарях, метаданих і журналі ревізій; по-друге, замінити вміст, а не лише візуально приховати його; по-третє, зберегти форматування без слідів.

Ключове слово — заміна. Оригінальний вміст повинен бути замінений чимось іншим, а не прихований під чимось іншим.

Заголовки, нижні колонтитули та приховані зони

Редагування юридичних документів має більше шарів, ніж просто основний текст. Конфіденційні дані часто з'являються в зонах, які візуальні інструменти повністю пропускають.

Заголовки та нижні колонтитули часто містять назви справ, ідентифікатори клієнтів і номери документів. Зачорнення тіла договору, залишаючи «Конфіденційно — Re: TechCorp» у заголовку, зводить нанівець усю мету.

Коментарі та відстежені зміни є поширеним джерелом ненавмисного розкриття. Рецензент, що коментує «дивіться примітку Джона Сміта», залишає це у файлі. Воно залишається навіть після того, як пункт приховано.

Властивості документа та метадані містять імена авторів і журнал ревізій. Вони можуть розкрити походження документа навіть коли тіло зачорнено.

Журнал ревізій у Word зберігає попередні версії відредагованого вмісту. Файл, у якому колись зазначалося «домашня адреса позивача — вул. Головна, 123», зберігає цю версію. Вона залишається, якщо її не очистити.

Побудова відповідного процесу

Врахування цих режимів помилок передбачає процес редагування з чотирма кроками.

1. Використовуйте нативну інтеграцію Word для файлів Word. Редагування в рамках об'єктної моделі Word замінює вміст безпосередньо у файлі. Це дозволяє уникнути проблеми приховування. Попереднє перетворення в PDF додає ризик і може пропустити коментарі та журнал ревізій.

2. Обробляйте всі зони документа. Відповідний процес повинен охоплювати заголовки, нижні колонтитули, виноски, кінцеві примітки, коментарі, відстежені зміни та властивості документа — а не лише основний текст.

3. Перевіряйте результат. Після редагування спробуйте відновити вміст. Скопіюйте та вставте відредаговані ділянки. Перевірте XML документа. Перегляньте відстежені зміни та журнал ревізій. Якщо оригінальний вміст з'являється де-небудь, редагування є неповним.

4. Зберігайте журнал аудиту. Для юридичних виробництв фіксуйте, що було відредаговано, яким методом і ким. Це важливо, якщо виникне спір щодо привілею. Дізнайтеся більше на нашій сторінці безпеки та відповідності.

Уроки справи Епштейна

Помилка у справі Епштейна стала публічним уроком. Вона показала, що відбувається, коли візуальне прикриття плутають із справжнім редагуванням.

Кожна юридична команда і фахівець із дотримання вимог, що стежили за цією новиною, повинні поставити два запитання. По-перше, що міститься в наших минулих виробництвах документів, що могло б бути так само відновлено? По-друге, чи наш поточний процес насправді видаляє вміст чи лише приховує його?

Від відповідей залежить реальний ризик — а не лише наявність політики редагування.


Надбудова Office від anonym.legal виконує справжню заміну персональних даних у файлах Word. Вона замінює вміст безпосередньо в структурі документа, а не накладає щось зверху візуально. Заголовки, нижні колонтитули, виноски, коментарі та відстежені зміни — всі обробляються. Результатом є файл, з якого оригінальні дані відсутні, а не приховані. Дізнайтеся більше.

Джерела

Готові захистити свої дані?

Почніть анонімізувати PII з 285+ типами сутностей на 48 мовах.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.