By · Last updated 2026-03-05

Powrót do blogaTechnologia prawna

Akta Epsteina: podświetlenie to nie redakcja – błąd, który ujawnił wrażliwe dane

Publikacja akt DOJ dotyczących Epsteina w grudniu 2025 r. ujawniła krytyczny błąd redakcji: tekst w PDF zaciemniony czarnym podświetleniem pozostaje czytelny po skopiowaniu.

March 5, 20267 min czytania
document redactionPDF redaction failurelegal complianceWord redaction

Grudniowy błąd redakcji 2025 r.

Zaktualizowano w 2026 r.

Amerykański Departament Sprawiedliwości opublikował akta dotyczące Epsteina w grudniu 2025 r. Relacje medialne szybko przesunęły się z treści akt na kwestię redakcji — a dokładniej na to, jak łatwo można ją było obejść.

Metoda była prosta. „Zredagowana” treść w plikach PDF była zakryta czarnym podświetleniem. Słowa jednak pozostają w warstwie tekstowej PDF. Skopiuj czarny prostokąt do edytora tekstu, a oryginalne słowa się pojawią. Wizualne zakrycie nie było prawdziwym usunięciem. Wrażliwe dane nigdy nie zostały usunięte.

Nie był to nowy błąd. W sprawie Anthony'ego Pellicano z 2007 r. wrażliwe dane zostały ujawnione przez nieprawidłowo zredagowane dokumenty złożone w federalnym sądzie. Ten sam błąd pojawiał się w dokumentach sądowych i raportach rządowych przez wiele lat. Jednak akta Epsteina uwidoczniły ten błąd dziesiątkom milionów ludzi w czasie rzeczywistym.

Więcej o deidentyfikacji dokumentów w kontekście prawnym — zobacz nasze omówienie zgodności z przepisami.

Wizualne zakrycie a prawdziwa redakcja

Dlaczego to wciąż się powtarza? Odpowiedź leży w kluczowej różnicy technicznej między wizualnym zakryciem a prawdziwym usunięciem.

Wizualne zakrycie umieszcza element nad słowami, ale ich nie usuwa z pliku. Do tej kategorii należą wszystkie poniższe metody. Czarne podświetlenie ustawia tło na czarny kolor. Białe słowa na białej stronie dopasowują kolor tekstu do tła. Czarny prostokąt narysowany nad tekstem zasłania widok. Warstwa adnotacji PDF dodaje nieprzezroczystą warstwę na wierzchu. Nakładka obrazu umieszcza czarny obraz nad słowami.

W każdym przypadku oryginalne słowa pozostają w pliku. Można je odnaleźć kopiując zaznaczony obszar lub usuwając warstwę zakrycia. Osoba z umiejętnościami technicznymi może też przeskanować surowy plik.

Prawdziwa redakcja usuwa słowa z pliku bezpowrotnie. Treść nie jest ukryta — jej nie ma. Nie ma niczego do odnalezienia.

Kluczowe pytanie dla każdego pliku, który wysyłasz na zewnątrz: gdy ktoś zbada ten plik, czy znajdzie oryginalne słowa? Przy wizualnym zakryciu odpowiedź brzmi tak. Zobacz nasz słowniczek po definicje pojęć związanych z redakcją.

Problem plików Word

Ten sam błąd istnieje w Microsoft Word. Użycie czarnego podświetlenia lub nieprzezroczystych prostokątów do „redakcji” pliku Word pozostawia oryginalne słowa w kodzie XML dokumentu.

Ma to znaczenie, bo Word jest głównym formatem dla pism prawnych, umów, dokumentów HR i wewnętrznych przeglądów. Organizacje używające podświetlenia wysyłały przez cały czas dokumenty z danymi, które można było odnaleźć.

71% zespołów prawnych korzysta z narzędzi AI pomimo obaw dotyczących przechowywania informacji (ankieta ACC 2025). W miarę jak narzędzia AI wkraczają do pracy z dokumentami, ryzyko ujawnienia dawnych błędów redakcji rośnie. AI czytający Twoje pliki może znaleźć słowa w „zredagowanych” sekcjach, które nigdy faktycznie nie zostały usunięte.

Głośne przypadki błędów redakcji

Akta Epsteina nie były pierwszym głośnym przypadkiem tego błędu.

Sprawa Anthony'ego Pellicano (2007) — wrażliwe dane ujawnione przez nieprawidłowo zredagowane dokumenty złożone w federalnym sądzie.

Dokumenty NSA udostępniane na podstawie wniosków FOIA wielokrotnie zawierały czytelne słowa pod czarnymi prostokątami. Badacze bezpieczeństwa dokumentowali to w wydaniach dotyczących bezpieczeństwa narodowego.

Akta w sporach korporacyjnych często zawierają czytelną treść, gdy strony używają warstw adnotacji PDF zamiast prawdziwego usunięcia.

Ten wzorzec wskazuje na fundamentalną lukę. Zespoły prawne traktują redakcję jako czynność wizualną. Jednak formaty PDF i Word zawierają strukturyzowane dane niezależnie od tego, co widzisz na ekranie.

Czego wymaga prawdziwa redakcja

Aby plik był naprawdę zredagowany, słowa muszą zostać usunięte i zastąpione. Wykwalifikowana osoba nie może ich odtworzyć.

W plikach PDF prawdziwa redakcja wymaga czterech kroków. Po pierwsze, spłaszczenie PDF w celu usunięcia wszystkich edytowalnych warstw. Po drugie, zastąpienie treści czarnymi prostokątami na poziomie strumienia zawartości. Po trzecie, usunięcie metadanych, które mogą przechowywać oryginalne słowa. Po czwarte, usunięcie osadzonych czcionek, które mogłyby umożliwić odzyskanie treści.

W plikach Word prawdziwa redakcja wymaga trzech kroków. Po pierwsze, znalezienie każdego wystąpienia docelowej treści — w śledzonych zmianach, komentarzach, metadanych i historii wersji. Po drugie, zastąpienie treści, a nie jej wizualne zakrycie. Po trzecie, zachowanie formatowania bez pozostawiania śladów.

Kluczowe słowo to zastąpienie. Oryginalna treść musi zostać zastąpiona czymś innym — nie ukryta pod czymś innym.

Nagłówki, stopki i ukryte obszary

Redakcja dokumentów prawnych ma więcej warstw niż tylko treść główna. Wrażliwe dane często pojawiają się w obszarach, które wizualne narzędzia całkowicie pomijają.

Nagłówki i stopki często zawierają nazwy spraw, identyfikatory klientów i numery dokumentów. Zaczernione ciało umowy, przy pozostawieniu w nagłówku tekstu „Poufne — dot.: TechCorp”, niweczy cel redakcji.

Komentarze i śledzone zmiany są częstym źródłem niezamierzonych ujawnień. Recenzent, który wpisał komentarz „patrz notatka Jana Kowalskiego”, pozostawia go w pliku — nawet po zakryciu klauzuli.

Właściwości dokumentu i metadane zawierają imiona autorów i historię wersji. Mogą ujawnić pochodzenie dokumentu nawet po zaczernieni ciała.

Historia wersji w programie Word przechowuje poprzednie wersje edytowanej treści. Plik, który niegdyś zawierał „adres zamieszkania powoda to ul. Kwiatowa 5”, zachowuje tę wersję — chyba że historia zostanie wyczyszczona.

Budowanie zgodnego procesu redakcji

Mając na uwadze te sposoby powstawania błędów, rzetelny proces redakcji wymaga czterech kroków.

1. Używaj natywnej integracji z Word dla plików Word. Redakcja w ramach modelu obiektowego Word zastępuje treść bezpośrednio w pliku, omijając problem zakrycia. Konwersja do PDF najpierw zwiększa ryzyko i może pominąć komentarze i historię wersji.

2. Przetwarzaj wszystkie obszary dokumentu. Zgodny proces musi obejmować nagłówki, stopki, przypisy dolne, endnotes, komentarze, śledzone zmiany i właściwości dokumentu — nie tylko treść główną.

3. Weryfikuj wynik. Po redakcji spróbuj odtworzyć treść. Skopiuj zredagowane obszary. Sprawdź kod XML dokumentu. Przejrzyj śledzone zmiany i historię wersji. Jeśli oryginalna treść pojawi się gdziekolwiek, redakcja jest niekompletna.

4. Prowadź ścieżkę audytu. W produkcjach prawnych rejestruj, co zostało zredagowane, jaką metodą i przez kogo. Ma to znaczenie, jeśli pojawi się spór dotyczący tajemnicy adwokackiej. Więcej informacji na naszej stronie bezpieczeństwa i zgodności.

Lekcje z akt Epsteina

Błąd w aktach Epsteina był publiczną lekcją. Pokazał, co się dzieje, gdy wizualne zakrycie jest mylone z prawdziwą redakcją.

Każdy prawnik i specjalista ds. compliance, który śledził tę historię, powinien zadać dwa pytania. Po pierwsze: co zawierają nasze wcześniejsze produkcje dokumentów, co można by podobnie odtworzyć? Po drugie: czy nasz obecny proces faktycznie usuwa treść, czy jedynie ją zakrywa?

Odpowiedzi determinują realne narażenie — nie samo istnienie polityki redakcji.


Dodatek do pakietu Office anonym.legal przeprowadza prawdziwe zastąpienie PII bezpośrednio w strukturze plików Word — nie nakładając zakrycia wizualnie. Nagłówki, stopki, przypisy, komentarze i śledzone zmiany — wszystkie są przetwarzane. Wynikiem jest plik, z którego oryginalne dane są nieobecne, a nie ukryte. Dowiedz się więcej.

Źródła

Gotowy, aby chronić swoje dane?

Rozpocznij anonimizację PII z 285+ typami podmiotów w 48 językach.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.