A Fekete Doboz Kiszerkesztési Csapda
Az Epstein-iratok, a Manafort-ügy és az NSA kiszivárogtatások egyetlen közös technikai hibával rendelkeznek: fekete téglalapot helyeztek az érzékeny szöveg fölé egy PDF rétegen — az alapul fekvő szöveg érintetlenül hagyásával.
A fekete doboz nem kiszerkesztés. Ez egy vizuális réteg.
A szöveg még mindig az adatban van. Bárki megnyithatja a PDF-et, kijelölheti a "kiszerkesztett" területet és kimásolhatja.
A PDF Rétegek Problémája
| Módszer | A képernyőn | Az adatban |
|---|---|---|
| Fekete kiemelés | Szöveg eltakarva | Szöveg megmarad |
| Laposított PDF | Szöveg nem jelölhető ki | OCR visszaállíthatja |
| Valódi kiszerkesztés | Szöveg eltakarva | Szöveg eltávolítva |
A Helyes Megközelítés
Valódi kiszerkesztés a szöveg rétegéből:
- PDF szöveges réteg kinyerése
- PII azonosítása a kinyert szövegben
- Az azonosított PII tokenekkel helyettesítve a szövegréteggel
- Új PDF generálása a névtelenített szövegréteggel
Az anonym.legal PDF kiszerkesztési megközelítése: Szövegalapú kiszerkesztés — nem rétegezés. Az érzékeny szöveg nem "eltakart" — ténylegesen nem szerepel a kimeneti fájlban.
Fontos: Automatizált pontosság nem 100%. Manuális ellenőrzési lépés szükséges az érzékeny jogi és orvosi dokumentumoknál.
Forrás: Brennan Center: PDF kiszerkesztési útmutató ügyvédeknek