By · Last updated 2026-06-05

Vissza a BlograJogi Technológia

A PDF-redakció csapdája: feltárt adatok

A DOJ Epstein-iratai, a Manafort-ügy és az NSA-szivárgások mind ugyanabban a hibában osztoznak: kozmetikai redakció, amely mögött a szöveg kinyerhető marad.

June 5, 20268 perc olvasás
PDF redactionlegal redactioncourt filingFOIAdocument security

A jogi dokumentumbiztonság legveszélyesebb szava: „Redakált”

Amikor egy bírósági beadvány „REDACTED” bélyeget kap, az ellenfél ügyvédje, az újságírók és a nyilvánosság azt feltételezi, hogy az információ eltűnt. Amikor ez a feltételezés téves — amikor a „redakált” szöveg másolás-beillesztéssel vagy PDF-szövegréteg-kinyeréssel hozzáférhető —, a következmények a szakmai szankcióktól egészen a nemzetbiztonsági kitettségig terjedhetnek.

A redakciómosás — vizuális fedőrétegek felvitele PDF-fájlokra az alapszöveg eltávolítása nélkül — egy sor nagy nyilvánosságot kapott esetnél okozott következményeket, amelyek bizonyítják, hogy ez nem elméleti kockázat.

A DOJ Epstein-iratai (2025. december): A bírósághoz benyújtott dokumentumokba fekete téglalapokat illesztettek az érzékeny szövegek fölé. Az alapszöveg másolás-beillesztéssel kinyerhető volt. Újságírók és nyilvános megfigyelők az iratok benyújtásától számított órákon belül felfedezték ezt. A kiszivárgott tartalom olyan neveket és részleteket tartalmazott, amelyek zár alatt tartásáért a szövetségi ügyészek korábban érveltek.

A Paul Manafort-ügy (2019. január): A védőügyvédek redakált bírósági iratokat nyújtottak be a Mueller-vizsgálatban a Microsoft Word beépített szövegkiemelő funkciójával — amely vizuális fekete sávot hoz létre az alapszöveg eltávolítása nélkül. A másolás-beillesztés azonnal feltárta a tartalmat. A bíróság nem volt elragadtatva.

NSA- és hírszerző közösségi dokumentumok (több eset): Évtizedek óta visszatérő téma a kinyerhető szövegű „redakált” PDF-kiadványok felfedezése újságírók és kutatók részéről. A Hírszerző Közösség Felügyeleti Testülete több útmutatót is kiadott kifejezetten erről a hibatípusról.

A minta következetes: valaki vizuális redakciót alkalmaz, az iratot biztonságosnak véli és benyújtja, majd az alapszöveg kiderül — néha azonnal, néha évekkel később, amikor a dokumentumokat újra megvizsgálják.

Hogyan működik (és miért vall kudarcot) a kozmetikai redakció?

A kozmetikai redakció kudarcának megértéséhez érteni kell a PDF szerkezetét.

Egy PDF-dokumentum több réteget tartalmaz:

Szövegréteg: A tényleges szöveges tartalom, koordinátákkal, betűtípusokkal és formázási metaadatokkal együtt tárolva. Ezt a réteget érik el a képernyőolvasók, a másolás-beillesztés és a szövegkinyerő eszközök.

Megjelenítési réteg: A dokumentum vizuális megjelenítésének utasításai — beleértve a képeket, grafikákat és színezett téglalapokat (a redakciós fedőrétegként használt fekete dobozokat).

Metaadatréteg: Dokumentumtulajdonságok, szerzői adatok, létrehozási időbélyegek, változtatástörténet.

A kozmetikai redakció egy feketével kitöltött téglalapot ad a megjelenítési réteghez. A téglalap vizuálisan a szöveg fölé kerül. A szövegréteg változatlan marad. Bárki, aki „Összes kijelölése” → másolás → beillesztés műveletet végez egy szövegszerkesztőben, a teljes szöveget visszakapja, beleértve a fekete téglalap „alatt” lévő részt is.

Kozmetikai redakciót előállító eszközök:

  • Adobe Acrobat rajzeszközök (amikor téglalapok rajzolására használják, nem a Redact funkcióval)
  • Microsoft Word változáskövetés (redakciós törlések, amelyek „elfogadottak”, de előzményük megmarad a fájlban)
  • Képalapú PDF-létrehozás (csak akkor biztonságos, ha az eredeti szövegréteget eltávolítják, nem ha képeket adnak a szöveg fölé)
  • Böngészőalapú PDF-annotáló eszközök (fekete kiemelés hozzáadása böngészőbeli nézegetőkben nem módosítja a szövegréteget)

Mit követel meg a valódi PDF-redakció?

A valódi redakciónak az információt a szövegrétegből kell eltávolítania, nem csupán a megjelenítési rétegből. A redakció valódiságát egyetlen módon lehet ellenőrizni: szövegkinyeréssel a „redakált” dokumentumból, majd annak megerősítésével, hogy a célzott tartalom hiányzik.

A bírósági iratok benyújtási egységei és a hírszerző közösség dokumentumkiadási programjai által alkalmazott redakció-ellenőrzési protokoll:

  1. Redakció alkalmazása szövegréteg-módosító eszközzel
  2. Exportálás új PDF-be
  3. Szövegkinyerés futtatása az exportált PDF-en
  4. Annak megerősítése, hogy a redakált tartalom hiányzik a kinyert szövegből
  5. A metaadatréteg vizsgálata maradék információra
  6. Az ellenőrzött dokumentum benyújtása

A 3. lépés az a kritikus ellenőrzés, amelyen a kozmetikai redakció elbukik: a kozmetikusan redakált PDF szövegkinyerése a teljes szöveget adja vissza. A valóban redakált PDF szövegkinyerése üres karakterláncokat vagy helyettesítő szöveget ad vissza a redakált régiókban.

A metaadat-probléma

A szövegrétegen túl a PDF-metaadatok másodlagos redakciós hibaforrást hoznak létre.

Egy PDF metaadatai tartalmazhatnak:

  • Szerzői nevet (a dokumentumot létrehozó személy nevét, gyakran az ügyvédét vagy az ügykezelőét)
  • Szervezet nevét (az ügyvédi irodát vagy a kormányzati ügynökséget)
  • A dokumentum korábbi verzióit, amelyek a redakció előtti tartalmat mutatják
  • Változástörténetet megjegyzésekkel vagy nyomon követett változásokkal
  • Beágyazott miniatűröket, amelyek a redakció előtti dokumentumtartalmat mutathatják

Az NSA 2015-ös „Magabiztosan redakálva” útmutatója kifejezetten foglalkozik a metaadatokkal: „A magabiztos redakáláshoz a metaadatok kezelése is szükséges.”

Bírósági iratok esetén a metaadat-kockázat jelentős: egy állítólag anonim fél által szerzett dokumentum metaadatai feltárhatják a szerző személyazonosságát. Egy redakált dokumentumba ágyazott miniatűr mutathatja az eredeti, redakció előtti verziót.

A valódi redakciós eszközök a redakálási folyamat részeként megtisztítják vagy törölik a metaadatokat. A kozmetikai redakciós eszközök jellemzően nem módosítják a metaadatokat.

A redakció kudarcának jogi következményei

A redakciós hibák szakmai és jogi következményei a kontextustól függnek, de a precedensek nem bíztatók azoknak a szakembereknek, akik kozmetikai redakcióra támaszkodnak:

Szövetségi bírósági kontextus: A Szövetségi Polgári Eljárásjogi Szabályzat 5.2(e) szabálya megköveteli, hogy a benyújtott dokumentumokban bizonyos személyes azonosítókat redakáljanak. A bíróságok pénzbírságot, iratbenyújtási korlátozásokat és ügyvédi kamara fegyelmi hatóságaihoz való áttételt szabtak ki redakciós hibákért.

FOIA-kontextus: Az Információszabadságról szóló törvény megköveteli a redakciós kivételek helyes alkalmazását. Azok az ügynökségek, amelyek kozmetikai redakciót alkalmaznak a FOIA-mentességi tartalmakra, miközben azt elektronikusan kinyerhetővé teszik, sikeres FOIA-perekkel szembesültek, amelyek valódi közzétételre kötelezték őket.

Hírszerzési/nemzetbiztonsági kontextus: A nyilvánosságra hozott hírszerzési műveletek politikai kellemetlen volta mellett a redakciós hibák révén azonosított személyek fokozott biztonsági kockázatnak voltak kitéve. A Hírszerzési Reform és Terrorizmus Megelőzési Törvény konkrét elszámoltathatóságot teremtett a dokumentumbiztonsági hibákért.

Adatvédelem (GDPR/HIPAA): Személyes adatok esetén a személyes azonosítók kinyerését lehetővé tevő redakciós hiba adatvédelmi eseménynek minősül, amely a GDPR 33. cikke és a HIPAA Jogsértési Értesítési Szabály szerinti értesítési kötelezettséget von maga után.

Redakció-ellenőrzési protokoll felépítése

Minden olyan szervezet számára, amely redakált információkat tartalmazó dokumentumokat nyújt be, egy egyszerű ellenőrzési protokoll kiküszöböli a kozmetikai redakció hibamódját:

Benyújtás előtti ellenőrzőlista:

  1. Redakció alkalmazása szövegréteg-módosító eszközzel (nem annotáció/fedőréteg)
  2. Exportálás új PDF-be
  3. Az exportált PDF megnyitása egy olyan friss nézegetőben, amelynek nincs hozzáférése az eredetihez
  4. Összes kijelölése → Másolás → Beillesztés egy egyszerű szövegszerkesztőbe
  5. Keresés a várhatóan redakált tartalom bármely részére
  6. Ha megtalálható: a dokumentum NEM valóban redakált — kezdje újra a megfelelő eszközzel
  7. Ha nem található: folytassa a metaadatok ellenőrzésével
  8. A PDF-tulajdonságoknál vizsgálja meg a Szerző, Alkotó, Tárgy, Kulcsszavak mezőket maradék információra
  9. Az ellenőrzött dokumentum kész a benyújtásra

Ez a protokoll dokumentumonként 5 percnél kevesebb időt vesz igénybe, és pozitív megerősítést ad arról, hogy a redakció valódi. Nagy mennyiségű környezetekben a szövegkinyerés automatizálható kötegelt benyújtás előtti ellenőrzésként.

A valódi redakció ellenőrzésére fordított öt perc kevesebbe kerül, mint az az egyetlen perc ügyvédi idő, amit egy szövetségi bíró előtti redakciós hiba megvédésére kell fordítani.

Források:

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.