A 2025 decemberi kitakarási kudarc
Amikor az amerikai Igazságügyi Minisztérium 2025 decemberében közzétette az Epstein-iratokat, a tudósítások hamar áttevődtek a dokumentumok tartalmáról a kitakarásokra — és különösen arra, milyen könnyen meg lehetett kerülni azokat.
A mechanizmus egyszerű volt: a PDF-fájlokban fekete kiemeléssel „kitakart” szöveg jelen marad a PDF szöveges rétegében. Ha a fekete téglalapot szövegszerkesztőbe másolod, az eredeti szöveg megjelenik. A vizuális elrejtés nem volt azonos a szöveg törlésével. Az érzékeny információt soha nem távolították el.
Ez nem volt új típusú sebezhetőség. Az Anthony Pellicano-ügyben (2007) szövetségi bírósági iratoknál nem megfelelő kitakarással tártak fel érzékeny információt. Ugyanez a hiba bírósági beadványokban, kormányzati jelentésekben és vállalati irattermelésben jelent meg az eltelt évek alatt. Az Epstein-iratok azonban nagy nyilvánosságuk miatt tették láthatóvá a kudarcot azok számára is, akik valós időben követték a hírt — több tízmillió ember számára.
Vizuális elrejtés és valódi kitakarás
Annak megértéséhez, miért ismétlődik ez újra és újra, meg kell érteni az elrejtés és a törlés közötti technikai különbséget.
A vizuális elrejtés vizuális elemet helyez a szöveg fölé anélkül, hogy magát a szöveget eltávolítaná a fájlstruktúrából. Ebbe a kategóriába tartozik:
- Fekete szövegkiemelés (a szöveg hátterét feketére állítja)
- Fehér szöveg fehér alapon (a szöveg színét az alaphoz igazítja)
- Fekete téglalap rajzolása a szöveg fölé
- PDF-kommentár-fedés (átlátszatlan annotációelemet ad hozzá)
- Képes fedés (fekete képet helyez a szöveg tetejére)
Mindegyik esetben az eredeti szöveg megmarad a fájlban. Visszanyerhető a takart rész másolásával, a fedőelem eltávolításával vagy a nyers fájlstruktúra vizsgálatával.
A valódi kitakarás véglegesen eltávolítja az alapszöveget a fájlból. A szöveg nem rejtett — eltűnt. Semmi nem marad vissza, amit helyre lehetne állítani.
Bármely, az ellenőrzéseden kívülre kerülő dokumentum esetén a kritikus kérdés: ha valaki technikai tudással vizsgálja ezt a fájlt, megtalálja-e az eredeti szöveget? Vizuális elrejtésnél a válasz igen.
A Word-dokumentum problémája
Ugyanez a hibamód létezik a Microsoft Word esetén is. Fekete szövegkiemeléssel, fehér betűszínnel vagy átlátszatlan szövegdobozokkal Word-dokumentumot „kitakarni” az eredeti szöveget érintetlenül hagyja a dokumentum XML-struktúrájában.
Ez azért fontos, mert a Word-dokumentumok az elsődleges formátum a jogi levelezéshez, szerződésekhez, tanúvallomásokhoz, HR-iratokhoz és belső vizsgálatokhoz. Az ezeket a módszereket alkalmazó szervezetek visszanyerhető tartalommal rendelkező dokumentumokat terjesztettek ezek teljes terjesztési előzményein keresztül.
A jogi csapatok 71%-a generatív MI-eszközöket használ adatelhelyezési aggályok ellenére (ACC 2025). Ahogy az MI-eszközök a dokumentummunkafolyamatok részévé válnak, a múltbeli kitakarási hibák felfedezésének kockázata nő — az MI-eszközök, amelyek dokumentumokat dolgoznak fel, felszínre hozhatnak szöveget a „kitakart” szakaszokból, amelyeket valójában soha nem töröltek.
A kitakarási kudarcok ismert esetei
Az Epstein-iratok nem az első ismert eset volt ebből a hibatípusból.
Az Anthony Pellicano-ügy (2007) során szövetségi bíróságon benyújtott jogellenesen kitakart jogi dokumentumokban érzékeny információ vált felismerhetővé.
A FOIA-kérelmek alapján közzétett NSA-dokumentumokban biztonsági kutatók és újságírók ismételten olvasható szöveget találtak fekete dobozok alatt PDF-kitakarási hibák miatt.
Vállalati peres iratokban rendszeresen megtalálható a véletlenül olvasható, kitakartnak hitt tartalom, amikor a beadványt tevő fél PDF-kommentár- vagy annotációs rétegeket használ a valódi tartalom törlése helyett.
Ez a következetes hibaminta egy alapvető szakadékot tükröz aközött, ahogyan a jogi szakemberek a kitakarást elképzelik (vizuális cselekvésként), és ahogyan a PDF- és Word-dokumentumformátumok valójában működnek (strukturált adatként, amely a vizuális megjelenéstől függetlenül szöveget tartalmaz).
Mit igényel a valódi kitakarás
Ahhoz, hogy egy dokumentum valóban ki legyen takarva — úgy, hogy technikailag hozzáértő befogadó sem tudja visszaállítani az eredeti tartalmat —, az alapszöveget el kell távolítani a fájlstruktúrából és helyettesíteni kell.
PDF-dokumentumoknál a valódi kitakarás megköveteli:
- A PDF lapítását az összes szerkeszthető réteg eltávolítása érdekében
- A szövegtartalom fekete téglalapokra vagy kitakarási jelölőkre cserélését a tartalomfolyam szintjén
- Az eredeti szöveget esetleg tartalmazó metaadatok eltávolítását
- A beágyazott betűtípusok eltávolítását, amelyek lehetővé tehetnék a szöveg rekonstrukcióját
Word-dokumentumoknál a valódi kitakarás megköveteli:
- Az eltávolítandó szöveg minden előfordulásának megkeresését (beleértve a nyomon követett változtatásokban, megjegyzésekben, verziótörténetben, metaadatokban és beágyazott objektumokban)
- A szövegtartalom cseréjét, nem pedig vizuális fedést
- A dokumentum formázásának megőrzését az eltávolított tartalomra utaló nyomok nélkül
A kulcsszó a csere: az eredeti szöveget valami mással kell helyettesíteni, nem valami mással eltakarni.
A fejlécek, láblécek és megjegyzések problémája
A jogi dokumentumok kitakarása az általános szövegtest kezelésén túl további bonyolultságot jelent. Az érzékeny információ olyan helyeken jelenik meg, amelyeket a vizuális kitakarási eszközök gyakran teljesen figyelmen kívül hagynak:
A fejlécek és láblécek gyakran tartalmaznak ügymegnevezéseket, ügyfélazonosítókat, bizalmas jelöléseket és dokumentumkezelési számokat. Egy szerződés törzsének fekete kiemeléssel való kitakarása, miközben a fejlécben ott marad a „Privilegizált és Bizalmas — Tárgy: TechCorp/MegaStartup felvásárlás” szöveg, meghiúsítja a kitakarás célját.
A megjegyzések és nyomon követett változtatások következetesen véletlenszerű közzétételek forrásai. Egy véleményező, aki „lásd John Smith tanúvallomását erről a cikkelyről” megjegyzést fűz, azt a megjegyzést a dokumentumban hagyja még akkor is, ha maga a cikkely „ki van takarva”.
A dokumentumtulajdonságok és metaadatok szerzőneveket, cégneveket, verziótörténetet és összefoglaló információkat tartalmaznak, amelyek azonosíthatják a dokumentum eredetét még akkor is, ha a tartalom ki van takarva.
A Word-dokumentumok verziótörténete megőrzi a szerkesztett szöveg korábbi verzióit. Egy dokumentum, amelyben az állt: „a felperes lakcíme: Budapest, Fő utca 12.” — és amelyet aztán „a felperes lakcíme”-re szerkesztettek — az eredeti verziót a verziótörténetben megőrzi, hacsak azt kifejezetten nem törlik.
Megfelelő kitakarási folyamat felépítése
A fenti hibamódok alapján egy megfelelő kitakarási folyamat megköveteli:
1. Natív Word-integráció Word-dokumentumoknál: A Word-dokumentumobjektum-modellen belül működő kitakarás — amely közvetlenül a dokumentumstruktúrában cseréli a szövegtartalmat — az egyetlen megközelítés, amely elkerüli az elrejtés és a törlés közötti problémát. A PDF-be konvertálás és a PDF kitakarása formátumátalakítási kockázatot vezet be, és előfordulhat, hogy nem kezeli megfelelően a megjegyzéseket, nyomon követett változtatásokat vagy verziótörténetet.
2. A dokumentum összes zónájának feldolgozása: Minden megfelelő kitakarási folyamatnak tartalmaznia kell a fejlécek, láblécek, lábjegyzetek, végjegyzetek, megjegyzések, nyomon követett változtatások és dokumentumtulajdonságok kifejezett feldolgozását — nem csak az általános szövegtörzsét.
3. A kimenet ellenőrzése: Kitakarás után ellenőrizd az eredményt a kitakart tartalom visszaállításának megkísérlésével. Másold be a kitakart területeket. Nyisd meg a dokumentum XML-struktúráját. Ellenőrizd a nyomon követett változtatásokat és a verziótörténetet. Ha az eredeti tartalom bárhol megjelenik, a kitakarás hiányos.
4. Auditnapló fenntartása: Jogi irattermelésnél dokumentálni kell, mi lett kitakarva, milyen módszerrel és ki által. Ez releváns lesz, ha titokvédelmi vita vagy kitakarási kihívás merül fel.
Az Epstein-iratok mint tanulság
Az Epstein-iratok kitakarási kudarca kényes helyzetbe hozta az Igazságügyi Minisztériumot, ugyanakkor konkrét, nyilvánosan látható demonstrációt nyújt arra, mi történik, ha a vizuális elrejtést összekeverik a valódi kitakarással.
Minden jogi csapatnak, kormányzati szervnek és megfelelési szakembernek, aki végignézte a híradást, fel kell tennie a kérdést: mit tartalmaznak szervezetünk múltbeli irattermeléseiben olyan dolgok, amelyek hasonlóan visszaállíthatók lehetnek? Mi a jelenlegi kitakarási folyamatunk, és az valóban törli-e a szöveget, vagy csupán eltakarja?
Ezekre a kérdésekre adott válaszok határozzák meg a tényleges kitettséget — nem egy kitakarási szabályzat megléte.
Az anonym.legal Office bővítménye valódi személyazonosításra alkalmas adatok cseréjét végzi Word-dokumentumokon belül — közvetlenül a dokumentumstruktúrában cseréli a szövegtartalmat, nem rak rá vizuálisan semmit. A fejlécek, láblécek, lábjegyzetek, megjegyzések és nyomon követett változtatások feldolgozásra kerülnek. Az eredmény egy olyan dokumentum, amelyből az eredeti szöveg hiányzik — nem rejtett.
Források:
- The Tech Savvy Lawyer: Hogyan takard ki megfelelően a PDF-dokumentumokat az Igazságügyi Minisztérium Epstein-iratai után
- Yahoo News: Az Epstein-iratok Igazságügyi Minisztériumi kitakarásait könnyen meg lehetett kerülni
- ACC 2025: A generatív MI növekvő stratégiai értéke a vállalati jogi osztályok számára