anonym.legal

By · Last updated 2026-06-05

Назад към блогаПравни технологии

Капанът при редактиране на PDF: Данните са разкрити

Файловете на DOJ по делото Epstein, делото Manafort и изтичанията от NSA споделят един и същ пропуск: козметично редактиране, при което основният текст остава извлекаем.

June 5, 20268 мин. четене
PDF redactionlegal redactioncourt filingFOIAdocument security

Най-опасната дума в сигурността на правни документи

Това ръководство е актуализирано за 2026 г.

Когато в съдебно дело пише "РЕДАКТИРАНО", хората приемат, че скритият текст е изчезнал. Понякога не е. Всеки може да копира и постави зачеркнат пасаж и да го прочете за секунди. Тази празнина има название: козметично редактиране. Тя е причинила реални щети.

Три случая доказват, че рискът не е хипотетичен.

Файловете на DOJ по делото Epstein (декември 2025 г.). Съдебни документи бяха подадени с черни ленти върху чувствителни имена. Текстът под тях беше четим чрез копиране и поставяне. Журналисти открили това в рамките на часове. Имената, за чието запечатване прокурорите настояваха, бяха разкрити.

Делото на Paul Manafort (януари 2019 г.). Адвокатите на защитата подадоха документи от разследването на Mueller, като използваха функцията за маркиране на Microsoft Word. Този инструмент рисува черна лента, но оставя думите непокътнати. Едно просто поставяне разкри всичко. Съдът не беше доволен.

Изтичания от NSA (множество години). В продължение на десетилетия PDF публикациите са съдържали извлекаем текст. Журналисти и изследователи са го откривали многократно. Съветът за надзор на разузнавателната общност издаде официални насоки точно за този тип пропуск.

Схемата е една и съща всеки път. Някой слага визуална лента. Подава файла. Скритият текст изплува. Понякога в рамките на часове. Понякога години по-късно.

Защо само черните ленти не са достатъчни

PDF файлът има три отделни слоя.

Слоят на съдържанието съхранява всички символи, координати и шрифтове. Инструментите за копиране и извличане четат оттук. Дисплейният слой съдържа визуални инструкции. Това включва форми, цветове, изображения и черните правоъгълници, използвани като покривни ленти. Слоят на метаданните съхранява свойствата на файла като името на автора, времевите маркери и историята на редакциите.

Козметичната лента живее само в дисплейния слой. Слоят на съдържанието под нея остава непокътнат. Избери всичко → Копирай → Постави връща всяка дума. Включително думите, "скрити" от лентата.

Инструменти, които създават само визуални ленти

Някои често срещани инструменти само боядисват текста. Те не го премахват.

Инструменти за рисуване в Adobe Acrobat. Рисуването на правоъгълник не е същото като използването на функцията Redact. Правоъгълникът е само визуален.

Проследяване на промени в Microsoft Word. Изтритите пасажи продължават да съществуват в историята на версиите дори след приемане. Историята все още е четима.

Анотатори за PDF в браузър. Те добавят черно маркиране. Не променят основните данни.

Наслагвания на изображения върху сканирани страници. Безопасни само ако текстовият слой е бил премахнат предварително. Без тази стъпка съхраненият текст остава непокътнат.

Какво изисква истинското редактиране

Истинското редактиране премахва информацията от слоя на съдържанието. Дисплейният слой тогава няма какво да показва. Потвърждавате успеха, като извличате текст от запазения файл. Проверявате, че целевият пасаж отсъства.

Звената за подаване на съдебни документи и разузнавателните агенции следват тази проверка:

  1. Използвайте инструмент, който променя слоя на съдържанието. Не използвайте инструмент, който само го покрива.
  2. Експортирайте в нов PDF.
  3. Отворете новия файл в нов преглед. Използвайте преглед без връзка с оригинала.
  4. Избери всичко → Копирай → Постави в редактор за обикновен текст.
  5. Търсете фрагмент от скрития пасаж.
  6. Намерихте го? Файлът не е истински обработен. Започнете отначало с правилния инструмент.
  7. Не намерихте? Преминете към проверка на метаданните.

Стъпка пет е критичният тест. Визуалните покрития го провалят всеки път. Правилно обработеният файл го преминава.

Проблемът с метаданните

Слоят на съдържанието не е единственият път за изтичане. Метаданните на файла могат да разкрият много.

Името на автора. Често адвокатът или ръководителят на делото, създал документа.

Организацията. Името на адвокатската кантора или агенцията.

По-ранни версии. Те показват документа преди да са направени промени.

История на редакциите. Проследените промени и коментари се съхраняват тук.

Вградени миниатюри. Те могат да показват документа в първоначалното му, необработено състояние.

Насоките на NSA гласят това директно. "Редактирането с увереност изисква метаданните също да бъдат контролирани."

За съдебни документи това е реален проблем. Документ, подаден от името на анонимна страна, може да съдържа метаданни с истинското име на автора. Зачернена версия може да съдържа миниатюра на оригинала. Правилните инструменти санират метаданните като част от процеса. Инструментите за визуално покриване не ги докосват.

Правни последствия

Последствията зависят от контекста. Прецедентът не е добър за никой, използващ само визуални покрития.

Федерални съдилища. Правило 5.2(e) от Федералните правила за гражданско производство изисква конкретни идентификатори да бъдат премахнати от подадените документи. Съдилищата са налагали глоби, забрани за подаване на документи и отнасяне до адвокатски съвети за нарушения тук.

FOIA спорове. Агенции, прилагащи визуални покрития върху освободена информация, могат все пак да имат тази информация извлечена. Съдилищата са разпореждали действително разкриване в такива случаи.

Национална сигурност. Персонал, разкрит чрез изтечени файлове, е изправен пред документирани рискове за сигурността. Разкриването надхвърля смущението.

GDPR и HIPAA. Извлекаемите лични данни представляват съобщаемо нарушение. Прилагат се член 33 от GDPR и Правилото за уведомление при нарушение на HIPAA.

Петминутна проверка преди подаване

Този контролен списък напълно елиминира риска от визуални покрития. Отнема под пет минути на документ.

  1. Използвайте инструмент за слоя на съдържанието. Не използвайте инструмент за рисуване или анотиране.
  2. Експортирайте в нов PDF. Не презаписвайте оригинала.
  3. Отворете новия файл в нов преглед.
  4. Избери всичко → Копирай → Постави в редактор за обикновен текст.
  5. Търсете известна фраза от скрития пасаж.
  6. Намерихте я? Започнете отначало с правилния инструмент.
  7. Проверете PDF свойствата: Автор, Създател, Тема, Ключови думи.
  8. Проверете за вградени миниатюри, показващи документа преди обработка.
  9. Подайте проверения документ.

Пет минути тук струват много по-малко от защитата пред федерален съдия поради неуспешно редактиране.

Свързано: Обяснено провалът при редактиране на файловете Epstein -- пълен анализ на инцидента от декември 2025 г.

Вижте също: AI асистенти за кодиране и изтичане на PII в production -- различен път за изтичане, същият урок.

anonym.legal предоставя автоматизирана проверка на текстовия слой за организации, работещи с чувствителни документи.

Източници

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.