By · Last updated 2026-03-05

Vissza a BlograJogi Technológia

Epstein-iratok: a kiemelés nem jelent kitakarást

A Igazságügyi Minisztérium 2025 decemberi Epstein-irat-kiadása egy kritikus kitakarási hibát tárt fel: a feketén kiemelve takart PDF-szöveg másolás-beillesztéssel olvasható marad.

March 5, 20267 perc olvasás
document redactionPDF redaction failurelegal complianceWord redaction

A 2025 decemberi kitakarási kudarc

Amikor az amerikai Igazságügyi Minisztérium 2025 decemberében közzétette az Epstein-iratokat, a tudósítások hamar áttevődtek a dokumentumok tartalmáról a kitakarásokra — és különösen arra, milyen könnyen meg lehetett kerülni azokat.

A mechanizmus egyszerű volt: a PDF-fájlokban fekete kiemeléssel „kitakart” szöveg jelen marad a PDF szöveges rétegében. Ha a fekete téglalapot szövegszerkesztőbe másolod, az eredeti szöveg megjelenik. A vizuális elrejtés nem volt azonos a szöveg törlésével. Az érzékeny információt soha nem távolították el.

Ez nem volt új típusú sebezhetőség. Az Anthony Pellicano-ügyben (2007) szövetségi bírósági iratoknál nem megfelelő kitakarással tártak fel érzékeny információt. Ugyanez a hiba bírósági beadványokban, kormányzati jelentésekben és vállalati irattermelésben jelent meg az eltelt évek alatt. Az Epstein-iratok azonban nagy nyilvánosságuk miatt tették láthatóvá a kudarcot azok számára is, akik valós időben követték a hírt — több tízmillió ember számára.

Vizuális elrejtés és valódi kitakarás

Annak megértéséhez, miért ismétlődik ez újra és újra, meg kell érteni az elrejtés és a törlés közötti technikai különbséget.

A vizuális elrejtés vizuális elemet helyez a szöveg fölé anélkül, hogy magát a szöveget eltávolítaná a fájlstruktúrából. Ebbe a kategóriába tartozik:

  • Fekete szövegkiemelés (a szöveg hátterét feketére állítja)
  • Fehér szöveg fehér alapon (a szöveg színét az alaphoz igazítja)
  • Fekete téglalap rajzolása a szöveg fölé
  • PDF-kommentár-fedés (átlátszatlan annotációelemet ad hozzá)
  • Képes fedés (fekete képet helyez a szöveg tetejére)

Mindegyik esetben az eredeti szöveg megmarad a fájlban. Visszanyerhető a takart rész másolásával, a fedőelem eltávolításával vagy a nyers fájlstruktúra vizsgálatával.

A valódi kitakarás véglegesen eltávolítja az alapszöveget a fájlból. A szöveg nem rejtett — eltűnt. Semmi nem marad vissza, amit helyre lehetne állítani.

Bármely, az ellenőrzéseden kívülre kerülő dokumentum esetén a kritikus kérdés: ha valaki technikai tudással vizsgálja ezt a fájlt, megtalálja-e az eredeti szöveget? Vizuális elrejtésnél a válasz igen.

A Word-dokumentum problémája

Ugyanez a hibamód létezik a Microsoft Word esetén is. Fekete szövegkiemeléssel, fehér betűszínnel vagy átlátszatlan szövegdobozokkal Word-dokumentumot „kitakarni” az eredeti szöveget érintetlenül hagyja a dokumentum XML-struktúrájában.

Ez azért fontos, mert a Word-dokumentumok az elsődleges formátum a jogi levelezéshez, szerződésekhez, tanúvallomásokhoz, HR-iratokhoz és belső vizsgálatokhoz. Az ezeket a módszereket alkalmazó szervezetek visszanyerhető tartalommal rendelkező dokumentumokat terjesztettek ezek teljes terjesztési előzményein keresztül.

A jogi csapatok 71%-a generatív MI-eszközöket használ adatelhelyezési aggályok ellenére (ACC 2025). Ahogy az MI-eszközök a dokumentummunkafolyamatok részévé válnak, a múltbeli kitakarási hibák felfedezésének kockázata nő — az MI-eszközök, amelyek dokumentumokat dolgoznak fel, felszínre hozhatnak szöveget a „kitakart” szakaszokból, amelyeket valójában soha nem töröltek.

A kitakarási kudarcok ismert esetei

Az Epstein-iratok nem az első ismert eset volt ebből a hibatípusból.

Az Anthony Pellicano-ügy (2007) során szövetségi bíróságon benyújtott jogellenesen kitakart jogi dokumentumokban érzékeny információ vált felismerhetővé.

A FOIA-kérelmek alapján közzétett NSA-dokumentumokban biztonsági kutatók és újságírók ismételten olvasható szöveget találtak fekete dobozok alatt PDF-kitakarási hibák miatt.

Vállalati peres iratokban rendszeresen megtalálható a véletlenül olvasható, kitakartnak hitt tartalom, amikor a beadványt tevő fél PDF-kommentár- vagy annotációs rétegeket használ a valódi tartalom törlése helyett.

Ez a következetes hibaminta egy alapvető szakadékot tükröz aközött, ahogyan a jogi szakemberek a kitakarást elképzelik (vizuális cselekvésként), és ahogyan a PDF- és Word-dokumentumformátumok valójában működnek (strukturált adatként, amely a vizuális megjelenéstől függetlenül szöveget tartalmaz).

Mit igényel a valódi kitakarás

Ahhoz, hogy egy dokumentum valóban ki legyen takarva — úgy, hogy technikailag hozzáértő befogadó sem tudja visszaállítani az eredeti tartalmat —, az alapszöveget el kell távolítani a fájlstruktúrából és helyettesíteni kell.

PDF-dokumentumoknál a valódi kitakarás megköveteli:

  • A PDF lapítását az összes szerkeszthető réteg eltávolítása érdekében
  • A szövegtartalom fekete téglalapokra vagy kitakarási jelölőkre cserélését a tartalomfolyam szintjén
  • Az eredeti szöveget esetleg tartalmazó metaadatok eltávolítását
  • A beágyazott betűtípusok eltávolítását, amelyek lehetővé tehetnék a szöveg rekonstrukcióját

Word-dokumentumoknál a valódi kitakarás megköveteli:

  • Az eltávolítandó szöveg minden előfordulásának megkeresését (beleértve a nyomon követett változtatásokban, megjegyzésekben, verziótörténetben, metaadatokban és beágyazott objektumokban)
  • A szövegtartalom cseréjét, nem pedig vizuális fedést
  • A dokumentum formázásának megőrzését az eltávolított tartalomra utaló nyomok nélkül

A kulcsszó a csere: az eredeti szöveget valami mással kell helyettesíteni, nem valami mással eltakarni.

A fejlécek, láblécek és megjegyzések problémája

A jogi dokumentumok kitakarása az általános szövegtest kezelésén túl további bonyolultságot jelent. Az érzékeny információ olyan helyeken jelenik meg, amelyeket a vizuális kitakarási eszközök gyakran teljesen figyelmen kívül hagynak:

A fejlécek és láblécek gyakran tartalmaznak ügymegnevezéseket, ügyfélazonosítókat, bizalmas jelöléseket és dokumentumkezelési számokat. Egy szerződés törzsének fekete kiemeléssel való kitakarása, miközben a fejlécben ott marad a „Privilegizált és Bizalmas — Tárgy: TechCorp/MegaStartup felvásárlás” szöveg, meghiúsítja a kitakarás célját.

A megjegyzések és nyomon követett változtatások következetesen véletlenszerű közzétételek forrásai. Egy véleményező, aki „lásd John Smith tanúvallomását erről a cikkelyről” megjegyzést fűz, azt a megjegyzést a dokumentumban hagyja még akkor is, ha maga a cikkely „ki van takarva”.

A dokumentumtulajdonságok és metaadatok szerzőneveket, cégneveket, verziótörténetet és összefoglaló információkat tartalmaznak, amelyek azonosíthatják a dokumentum eredetét még akkor is, ha a tartalom ki van takarva.

A Word-dokumentumok verziótörténete megőrzi a szerkesztett szöveg korábbi verzióit. Egy dokumentum, amelyben az állt: „a felperes lakcíme: Budapest, Fő utca 12.” — és amelyet aztán „a felperes lakcíme”-re szerkesztettek — az eredeti verziót a verziótörténetben megőrzi, hacsak azt kifejezetten nem törlik.

Megfelelő kitakarási folyamat felépítése

A fenti hibamódok alapján egy megfelelő kitakarási folyamat megköveteli:

1. Natív Word-integráció Word-dokumentumoknál: A Word-dokumentumobjektum-modellen belül működő kitakarás — amely közvetlenül a dokumentumstruktúrában cseréli a szövegtartalmat — az egyetlen megközelítés, amely elkerüli az elrejtés és a törlés közötti problémát. A PDF-be konvertálás és a PDF kitakarása formátumátalakítási kockázatot vezet be, és előfordulhat, hogy nem kezeli megfelelően a megjegyzéseket, nyomon követett változtatásokat vagy verziótörténetet.

2. A dokumentum összes zónájának feldolgozása: Minden megfelelő kitakarási folyamatnak tartalmaznia kell a fejlécek, láblécek, lábjegyzetek, végjegyzetek, megjegyzések, nyomon követett változtatások és dokumentumtulajdonságok kifejezett feldolgozását — nem csak az általános szövegtörzsét.

3. A kimenet ellenőrzése: Kitakarás után ellenőrizd az eredményt a kitakart tartalom visszaállításának megkísérlésével. Másold be a kitakart területeket. Nyisd meg a dokumentum XML-struktúráját. Ellenőrizd a nyomon követett változtatásokat és a verziótörténetet. Ha az eredeti tartalom bárhol megjelenik, a kitakarás hiányos.

4. Auditnapló fenntartása: Jogi irattermelésnél dokumentálni kell, mi lett kitakarva, milyen módszerrel és ki által. Ez releváns lesz, ha titokvédelmi vita vagy kitakarási kihívás merül fel.

Az Epstein-iratok mint tanulság

Az Epstein-iratok kitakarási kudarca kényes helyzetbe hozta az Igazságügyi Minisztériumot, ugyanakkor konkrét, nyilvánosan látható demonstrációt nyújt arra, mi történik, ha a vizuális elrejtést összekeverik a valódi kitakarással.

Minden jogi csapatnak, kormányzati szervnek és megfelelési szakembernek, aki végignézte a híradást, fel kell tennie a kérdést: mit tartalmaznak szervezetünk múltbeli irattermeléseiben olyan dolgok, amelyek hasonlóan visszaállíthatók lehetnek? Mi a jelenlegi kitakarási folyamatunk, és az valóban törli-e a szöveget, vagy csupán eltakarja?

Ezekre a kérdésekre adott válaszok határozzák meg a tényleges kitettséget — nem egy kitakarási szabályzat megléte.


Az anonym.legal Office bővítménye valódi személyazonosításra alkalmas adatok cseréjét végzi Word-dokumentumokon belül — közvetlenül a dokumentumstruktúrában cseréli a szövegtartalmat, nem rak rá vizuálisan semmit. A fejlécek, láblécek, lábjegyzetek, megjegyzések és nyomon követett változtatások feldolgozásra kerülnek. Az eredmény egy olyan dokumentum, amelyből az eredeti szöveg hiányzik — nem rejtett.

Források:

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.