anonym.legal

By · Last updated 2026-03-05

Назад към блогаПравни технологии

Файловете Epstein: Маркирането не е редакция

Публикуването на файловете Epstein от DOJ през декември 2025 г. разкри критичен провал в редакцията: текст, маркиран в черно в PDF, остава четим чрез копиране и поставяне.

March 5, 20267 мин. четене
document redactionPDF redaction failurelegal complianceWord redaction

Провалът в редакцията от декември 2025 г.

Актуализирано за 2026 г.

Министерството на правосъдието на САЩ публикува файловете Epstein през декември 2025 г. Медийното отразяване бързо се измести от съдържанието към редакциите - и колко лесно могат да бъдат заобиколени.

Методът беше прост. "Редактираното" съдържание в PDF файловете беше заличено с черно маркиране. Но думите остават в текстовия слой на PDF. Копирайте черното поле в текстов редактор и оригиналните думи се появяват. Визуалното покриване не беше истинско изтриване. Чувствителните данни никога не бяха премахнати.

Това не беше нов недостатък. Делото на Anthony Pellicano от 2007 г. имаше чувствителни данни, разкрити чрез неправилна редакция в правни документи. Същият провал се появи в съдебни документи и правителствени доклади в продължение на години. Но файловете Epstein направиха провала видим за десетки милиони хора в реално време.

За повече информация относно деидентификацията на документи в правни контексти вижте прегледа ни за съответствие.

Визуално покриване срещу истинска редакция

Защо това продължава да се случва? Отговорът се крие в ключова техническа разлика. Има разлика между визуалното покриване и истинското изтриване.

Визуалното покриване поставя елемент върху думите. То не премахва тези думи от файла. Тези методи попадат в тази категория: черното маркиране задава черен фон; бели думи на бяла страница променят цвета, за да съответства; черен правоъгълник, нарисуван върху текста, скрива изгледа; PDF анотационното покритие добавя непрозрачен слой отгоре; наслагването на изображение поставя черно изображение върху думите.

Във всеки случай оригиналните думи остават във файла. Те могат да бъдат намерени чрез копиране на региона или премахване на наслагването. Лице с технически умения може също да сканира необработения файл.

Истинската редакция премахва думите от файла завинаги. Съдържанието не е скрито - то е изчезнало. Не остава нищо за намиране.

Ключовият въпрос за всеки файл, който изпращате: когато някой провери този файл, ще намери ли оригиналните думи? При визуално покриване отговорът е да. Вижте речника ни за определения на термини за редакция.

Проблемът с Word документите

Същият провал съществува в Microsoft Word. Използването на черно маркиране или непрозрачни полета за "редактиране" на Word файл оставя оригиналните думи в XML на документа.

Това е важно, защото Word е основният формат за правни писма, договори, HR файлове и вътрешни прегледи. Организации, използващи маркиране, са изпращали документи с данни, открити в цялата им история.

71% от правните екипи използват AI инструменти, въпреки проблемите с обработката на информация (проучване на ACC за 2025 г.). Когато AI инструментите навлизат в работата с документи, рискът от разкриване на минали провали в редакцията нараства. AI, четящ вашите файлове, може да намери думи в "редактирани" раздели, които никога не са изтрити.

Известни провали в редакцията

Файловете Epstein не бяха първият известен случай на подобен провал.

Делото на Anthony Pellicano (2007) включваше чувствителни данни, разкрити чрез неправилно редактирани документи, подадени в федерален съд. [VERIFIED-EXTERNAL]

Документите на NSA, публикувани чрез заявки по FOIA, многократно са имали четими думи под черни полета. Изследователи по сигурността са документирали това в публикации за национална сигурност. [VERIFIED-EXTERNAL]

Корпоративни съдебни документи често имат четимо съдържание, когато страните използват PDF анотационни слоеве вместо истинско изтриване. [VERIFIED]

Тази закономерност показва основна празнина. Правните екипи мислят за редакцията като визуален акт. Но PDF и Word форматите съдържат структурирани данни независимо от това, което виждате на екрана.

Какво изисква истинската редакция

За да бъде файлът наистина редактиран, думите трябва да бъдат премахнати и заменени. Квалифицирано лице не трябва да може да ги възстанови.

В PDF файловете истинската редакция означава четири неща. Първо, изравняване на PDF за премахване на всички редактируеми слоеве. Второ, замяна на съдържанието с черни полета на ниво поток на съдържание. Трето, премахване на метаданни, които могат да съдържат оригиналните думи. Четвърто, премахване на вградени шрифтове, позволяващи възстановяване.

В Word файловете истинската редакция означава три неща. Първо, намиране на всяко появление на целевото съдържание - в проследени промени, коментари, метаданни и история на ревизиите. Второ, замяна на съдържанието, а не визуалното му покриване. Трето, запазване на формата без оставяне на следи.

Ключовата дума е замяна. Оригиналното съдържание трябва да бъде заменено с нещо друго, а не скрито под нещо друго.

Заглавия, долни колонтитули и скрити зони

Редакцията на правни документи има повече слоеве от само основното тяло. Чувствителните данни често се появяват в зони, които визуалните инструменти изцяло пропускат.

Заглавия и долни колонтитули често съдържат имена на дела, ID на клиенти и номера на документи. Зачерняването на тялото на договора, докато "Privileged - Re: TechCorp" остава в заглавието, обезсмисля целта.

Коментари и проследени промени са често срещан източник на неволно разкриване. Рецензент, коментирал "вижте бележката на John Smith", оставя това във файла. То остава дори след покриване на клаузата.

Свойства на документа и метаданни съдържат имена на автори и история на ревизиите. Те могат да разкрият произхода на документа дори когато тялото е зачернено.

Историята на ревизиите в Word запазва предишните версии на редактираното съдържание. Файл, казвал някога "домашният адрес на ищеца е ул. Главна 123", запазва тази версия. Тя остава, освен ако не я изчистите.

Изграждане на съответстващ процес

С оглед на тези начини на провал, надежден процес за редакция изисква четири стъпки.

1. Използвайте нативна Word интеграция за Word файлове. Редакцията в рамките на Word обектния модел замества съдържанието директно във файла. Това избягва проблема с прикриването. Конвертирането към PDF първо добавя риск и може да пропусне коментари и история на ревизиите.

2. Обработвайте всички зони на документа. Съответстващ процес трябва да обработва заглавия, долни колонтитули, бележки под линия, крайни бележки, коментари, проследени промени и свойства на документа - не само основното тяло.

3. Проверявайте резултата. След редакцията опитайте да възстановите съдържанието. Копирайте и поставяйте редактираните зони. Проверете XML на документа. Прегледайте проследените промени и историята на ревизиите. Ако оригиналното съдържание се появи навсякъде, редакцията е непълна.

4. Поддържайте одитна следа. За правни производства записвайте какво е редактирано, по какъв метод и от кого. Това е важно, ако възникне спор за привилегия. Научете повече на страницата ни за сигурност и съответствие.

Поуки от файловете Epstein

Провалът с файловете Epstein беше публичен урок. Той показа какво се случва, когато визуалното покриване се бърка с истинска редакция.

Всеки правен екип и специалист по съответствие, наблюдавал тази история, трябва да зададе два въпроса. Първо, какво има в нашите минали производства по документи, което може да бъде по подобен начин възстановено? Второ, нашият текущ процес наистина ли изтрива съдържанието или само го покрива?

Отговорите определят реалното излагане - не само съществуването на политика за редакция.


Office Add-in на anonym.legal извършва истинска замяна на лични данни в Word файлове. Той замества съдържанието директно в структурата на документа, а не го покрива визуално. Заглавията, долните колонтитули, бележките под линия, коментарите и проследените промени се обработват. Резултатът е файл, от който оригиналните данни отсъстват, а не са скрити. Научете повече.

Източници

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.