By · Last updated 2026-03-05

Atgal į BlogąTeisinė Technologija

Epsteino bylos dokumentai: paryškinimas nera redakcija

2025 m. gruodžio mėn. Teisingumo departamento Epsteino bylų atskleidimas atskleidė kritinį redakcijos trūkumą: juodai paryškintas PDF tekstas lieka skaitomas kopijuojant ir įklijuojant.

March 5, 20267 min skaityti
document redactionPDF redaction failurelegal complianceWord redaction

2025 m. gruodžio mėn. redakcijos nesėkmė

Atnaujinta 2026 metais

JAV Teisingumo departamentas išleido Epsteino bylos dokumentus 2025 m. gruodį. Žiniasklaidos dėmesys greitai persiorientavo nuo turinio prie redakcijų. Susidomėjimą sukėlė tai, kaip lengvai buvo galima jas apeiti.

Būdas buvo paprastas. PDF failuose "redaguotas" turinys buvo paslėptas paryškinant juodai. Tačiau žodžiai lieka PDF teksto sluoksnyje. Nukopijuokite juodą dėžutę į teksto redaktorių ir originalūs žodžiai pasirodo. Vizualus uždengimas nebuvo tikras ištrynimas. Jautrūs duomenys niekada nebuvo pašalinti.

Tai nebuvo nauja klaida. 2007 m. Anthony Pellicano byloje jautrūs duomenys buvo atskleisti dėl netinkamos redakcijos teismo procesuose. Ta pati nesėkmė atsirasdavo teismo dokumentuose ir valdžios ataskaitose metų metais. Tačiau Epsteino bylos padarė šią nesėkmę matomą dešimtims milijonų žmonių realiuoju laiku.

Daugiau informacijos apie dokumentų de-identifikavimą teisiniame kontekste rasite mūsų atitikties apžvalgoje.

Vizualinis uždengimas vs. tikra redakcija

Kodėl tai nuolat kartojasi? Atsakymas glūdi esminiame techniniame atotrūkyje. Yra skirtumas tarp vizualinio uždengimo ir tikro ištrynimo.

Vizualinis uždengimas uždeda elementą ant žodžių. Jis nepašalina tų žodžių iš failo. Šios metodai visi priklauso šiai grupei: juodas paryškinimas nustato foną juodai; balti žodžiai baltame puslapyje keičia spalvą, kad sutaptų; ant teksto nubrėžtas juodas stačiakampis slepia vaizdą; PDF anotacijos uždanga prideda nepermatomą sluoksnį viršuje; vaizdo uždanga uždeda juodą vaizdą ant žodžių.

Kiekvienu atveju originalūs žodžiai lieka faile. Juos galima rasti nukopijuojant sritį arba pašalinant uždangą. Techniškai išmanas asmuo taip pat gali nuskaityti neapdorotą failą.

Tikra redakcija pašalina žodžius iš failo visam laikui. Turinys ne slepiamas — jo nebėra. Nieko neliko rasti.

Pagrindinis klausimas dėl bet kurio siunčiamo failo: kai kas nors patikrina šį failą, ar jie ras originalius žodžius? Su vizualiniu uždengimas — taip. Peržiūrėkite mūsų žodynėlį dėl redakcijos sąvokų apibrėžimų.

Problemos su Word dokumentais

Ta pati nesėkmė egzistuoja ir Microsoft Word. Naudojant juodą paryškinimą ar nepermatomas dėžutes "redaguojant" Word failą, originalūs žodžiai lieka dokumento XML.

Tai svarbu, nes Word yra pagrindinė teisinių laiškų, sutarčių, personalo failų ir vidinių peržiūrų formatų. Grupės, naudojančios paryškinimą, visą savo istoriją siuntinėjo dokumentus su duomenimis, kuriuos galima rasti.

71 % teisinių komandų naudoja DI įrankius nepaisant informacijos saugojimo susirūpinimų (ACC 2025 apklausa). Kai DI įrankiai patenka į dokumentų darbą, didėja rizika išaiškinti praeities redakcijos nesėkmes. DI, skaitantis jūsų failus, gali rasti žodžius "redaguotose" sekcijose, kurios iš tikrųjų niekada nebuvo ištrintos.

Žinomi redakcijos nesėkmių atvejai

Epsteino bylos nebuvo pirmasis didelio profilio tokios nesėkmės atvejis.

Anthony Pellicano byloje (2007) jautrūs duomenys buvo atskleisti dėl netinkamai redaguotų dokumentų, pateiktų federaliniame teisme. [PATIKRINTA-IŠORIŠKAI]

NSA dokumentuose, išleistuose per FOIA prašymus, nuolat buvo skaitomi žodžiai po juodais dėžutėmis. Saugumo tyrėjai tai dokumentavo nacionalinio saugumo leidiniuose. [PATIKRINTA-IŠORIŠKAI]

Korporatyvinių teismo procesų dokumentuose dažnai yra skaitomas turinys, kai šalys naudoja PDF anotacijų sluoksnius vietoj tikro ištrynimo. [PATIKRINTA]

Šis modelis rodo pagrindinę spragą. Teisinės komandos mąsto apie redakciją kaip vizualų veiksmą. Tačiau PDF ir Word formatai turi struktūrizuotus duomenis, nepriklausomai nuo to, ką matote ekrane.

Ko reikia tikrai redakcijai

Kad failas būtų tikrai redaguotas, žodžiai turi būti pašalinti ir pakeisti. Kvalifikuotas asmuo neturi gebėti jų atkurti.

PDF failuose tikra redakcija reiškia keturis dalykus: pirma, išlyginkite PDF, kad pašalintumėte visus redaguojamus sluoksnius; antra, pakeiskite turinį juodais dėžutėmis turinio srauto lygmeniu; trečia, pašalinkite metaduomenis, kuriuose gali būti originalūs žodžiai; ketvirta, pašalinkite įterptus šriftus, kurie galėtų leisti atkūrimą.

Word failuose tikra redakcija reiškia tris dalykus: pirma, raskite kiekvieną tiksliniego turinio atvejį — sekamų pakeitimų, komentarų, metaduomenų ir peržiūros istorijoje; antra, pakeiskite turinį, o ne vizualiai jį uždenkite; trečia, išlaikykite formatą nepaliekant žymių.

Pagrindininis žodis yra pakeitimas. Originalus turinys turi būti pakeistas kuo kitu, o ne paslėptas po kuo kitu.

Antraštės, poraštės ir paslėptos zonos

Teisinių dokumentų redakcija turi daugiau sluoksnių nei tik pagrindinis kūnas. Jautri informacija dažnai pasirodo zonose, kurias vizualiniai įrankiai visiškai praleidžia.

Antraštėse ir poraštėse dažnai yra bylos pavadinimai, kliento ID ir dokumentų numeriai. Sutarties kūno juodinimas paliekant "Privileged - Re: TechCorp" antraštėje panaikina tikslą.

Komentarai ir sekami pakeitimai yra dažnas netyčinio atskleidimo šaltinis. Recenzentas, komentuojantis "žr. Jono Janovičiaus pastabą", palieka tai faile. Tai lieka net po to, kai straipsnis uždengiamas.

Dokumento ypatybės ir metaduomenys turi autoriaus vardus ir peržiūros istoriją. Jie gali atskleisti dokumento kilmę net tada, kai kūnas yra juodinamas.

Peržiūros istorija Word programoje išsaugo ankstesnes redaguoto turinio versijas. Failas, kuriame kadaise buvo parašyta "ieškovo namų adresas yra Kauno g. 123", išlaiko tą versiją. Ji lieka, kol jos neišvalysite.

Atitinkamo proceso kūrimas

Atsižvelgiant į šiuos nesėkmių būdus, patikimas redakcijos procesas reikalauja keturių žingsnių.

1. Naudokite gimtąją Word integraciją Word failams. Redakcija Word objekto modelyje keičia turinį tiesiogiai faile. Tai leidžia išvengti slėpimo problemos. Pirmiausia konvertavimas į PDF prideda riziką ir gali praleisti komentarus bei peržiūros istoriją.

2. Apdorokite visas dokumento zonas. Atitinkamas procesas turi apimti antraštes, poraštes, išnašas, galines pastabas, komentarus, sekamus pakeitimus ir dokumento ypatybes — ne tik pagrindinį kūną.

3. Patikrinkite rezultatą. Po redakcijos bandykite atkurti turinį. Nukopijuokite ir įklijuokite redaguotas sritis. Patikrinkite dokumento XML. Peržiūrėkite sekamus pakeitimus ir peržiūros istoriją. Jei originalus turinys pasirodo bet kur, redakcija yra neišsami.

4. Palaikykite audito seką. Teisinėms gamyboms fiksuokite, kas buvo redaguota, kokiu metodu ir kieno. Tai svarbu, jei kyla privilegijos ginčas. Sužinokite daugiau mūsų saugumo ir atitikties puslapyje.

Pamokos iš Epsteino bylų

Epsteino bylų nesėkmė buvo vieša pamoka. Ji parodė, kas nutinka, kai vizualinis uždengimas supainiojamas su tikra redakcija.

Kiekviena teisinė komanda ir atitikties specialistas, stebėjęs šią istoriją, turėtų užduoti du klausimus. Pirma, kas yra mūsų ankstesniuose dokumentų atskleidimo dokumentuose, ką galima panašiai atkurti? Antra, ar mūsų dabartinis procesas iš tikrųjų ištrina turinį ar tik jį dengia?

Atsakymai lemia tikrą poveikį — ne tik redakcijos politikos egzistavimą.


anonym.legal Office priedas atlieka tikrą PII pakeitimą Word failuose. Jis keičia turinį tiesiogiai dokumento struktūroje, o ne vizualiai ant jo. Apdorojamos antraštės, poraštės, išnašos, komentarai ir sekami pakeitimai. Rezultatas — failas, iš kurio originalūs duomenys yra nebuvę, o ne tik paslėpti. Sužinokite daugiau.

Šaltiniai

Pasiruošę apsaugoti savo duomenis?

Pradėkite anonimizuoti PII su 285+ subjektų tipais 48 kalbomis.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.