By · Last updated 2026-06-05

Atpakaļ uz BloguJuridiskā Tehnoloģija

PDF redakcijas lamatas: dati ir atklati

DOJ Epsteina lietas dokumenti, Manaforta lieta un NSA nopludes dalija vienu un to pasu neveiksmju iemeslu: kosmētiska redakcija, kas atstaj pamatekstu izvilkjamu.

June 5, 20268 min lasīšanai
PDF redactionlegal redactioncourt filingFOIAdocument security

Bistamakaie vards juridisko dokumentu drosiba

Šis celvedis tika atjauninats 2026. gadam.

Kad tiesas dokumenta rakstits "REDAGĒTS", cilveki pienem, ka sleeptais teksts ir nodzests. Dazreiz ta nav. Jebkurš var kopet un ielīmēt aptumšoto daļu un dažu sekunžu laika to izlasīt. Šai nepilnībai ir nosaukums: kosmētiskā redakcija. Tā ir nodarijusi reālu kaitejumu.

Tris lietas pierāda, ka risks nav hipotētisks.

DOJ Epsteina lietas dokumenti (2025. gada decembris). Tiesas dokumenti tika iesniegti ar melniem joslu uz jutīgiem vardiem. Teksts apaksā bija lasāms ar kopēšanu-ielīmēšanu. Žurnālisti to atklāja dažu stundu laika. Vardi, kurus prokurori apgalvoja, ka jāpaliek noslēpti, tika atklāti.

Paula Manaforta lieta (2019. gada janvāris). Aizstāvji iesniedza Muellera dokumentus, izmantojot Microsoft Word izcelšanas funkciju. Šis rīks uzzīmē melnu joslu, bet atstāj vardus neskartu. Vienkārša ielīmēšana atklāja visu. Tiesa nebija apmierināta.

NSA noplūdes (vairāki gadi). Gadu desmitiem ilgu PDF izlaidumu satur izvilkjamu tekstu. Žurnālisti un pētnieki to atrādāja atkārtoti. Izlūkošanas kopienas pārraudzības padome izdeva formālas vadlīnijas par šo neveiksmju veidu.

Modelis ir vienāds katru reizi. Kads uzklāj vizuālu joslu. Viņi iesniedz failu. Sleptais teksts parādās. Dažreiz dažu stundu laika. Dažreiz gadus vēlāk.

Kāpēc melnas joslas vienas pašas neizdodas

PDF failam ir tris atsevišķi slāņi.

Satura slānis glabā visas rakstzīmes, koordinātas un fontus. Kopēšanas-ielīmēšanas un izvilkšanas rīki lasa no šejienes. Attēlojuma slānis glabā vizuālos norādijumus. Tas ietver formas, krāsas, attēlus un melnas taisnstūri, ko izmanto kā pārklājuma joslas. Metadatu slānis glabā faila rekvizītus, piemēram, autora vārdu, laika zīmogus un versiju vēsturi.

Kosmētiskā josla dzīvo tikai attēlojuma slānī. Apakšā esošais satura slānis ir neskarts. Atlasīt visu → Kopēt → Ielīmēt atgriež katru vārdu. Tas ietver vardus, kuri "slēpti" ar joslu.

Rīki, kas rada tikai vizuālas joslas

Daži izplatīti rīki tikai uzkrāso tekstu. Tie to nenoņem.

Adobe Acrobat zīmēšanas rīki. Taisnstūra zīmēšana nav tas pats, kas Redact funkcijas izmantošana. Taisnstūris ir tikai vizuāls.

Microsoft Word izmaiņu izsekošana. Dzēstās daļas saglabājas versiju vēsturē pat pēc apstiprināšanas. Vēsture joprojām ir lasāma.

Pārlūkprogrammas PDF anotatori. Šie pievieno melnu izcēlumu. Tie nemaina pamatdatus.

Attēlu pārklājumi uz skenētām lapam. Drošs tikai tad, ja sākotnējais teksta slānis vispirms tika izdzēsts. Bez šī soļa saglabātais teksts paliek neskaits.

Ko prasa īsta redakcija

Istā redakcija noņem informāciju no satura slāņa. Attēlojuma slānim tad nav ko rādīt. Jūs apstipriniet veiksmi, izvilkstot tekstu no saglabātā faila. Jūs pārbaudiet, vai mērķa daļa nav atrodama.

Tiesas lietu nodaļas un izlūkošanas aģentūras veic šo pārbaudi:

  1. Izmantojiet rīku, kas maina satura slāni. Neizmantojiet rīku, kas to uzglezno.
  2. Eksportējiet uz jaunu PDF.
  3. Atveriet jauno failu tīrā skatīšanas rīkā. Izmantojiet skatītāju, kuram nav saistības ar oriģinālu.
  4. Atlasīt visu → Kopēt → Ielīmēt vienkāršā teksta redaktorā.
  5. Meklējiet jebkuru fragmentu no sleptās daļas.
  6. Atrasts? Fails nav patiesi apstrādāts. Sāciet no jauna ar pareizo rīku.
  7. Nav atrasts? Turpiniet ar metadatu pārbaudi.

Piektais solis ir kritiskā pārbaude. Vizuālie pārklājumi to vienmēr neizdodas izturēt. Pareizi apstrādāts fails to iztur.

Metadatu problēma

Satura slānis nav vienīgā noplūdes vieta. Faila metadati var atklāt daudz.

Autora vārds. Bieži vien advokāts vai lietas vadītājs, kurš veidoja dokumentu.

Organizācija. Advokātu biroja vai aģentūras nosaukums.

Agrākas versijas. Šīs rāda dokumentu pirms jebkādām izmaiņām.

Versiju vēsture. Izsekotās izmaiņas un komentāri tiek glabāti šeit.

Iegultie sīktēli. Šie var rādīt dokumentu tā sākotnējā, neapstrādātajā stāvoklī.

NSA vadlīniju dokuments to apliecina tieši. "Redagēšana ar pārliecību prasa, lai metadati arī tiktu kontrolēti."

Tiesas dokumentu iesniegšanai tas ir reāla problēma. Dokumentu, kas iesniegts anonīmas puses vārdā, var saturēt metadatus, kas nosauc īsto autoru. Aptumšota versija var saturēt oriģināla sīktēlu. Pareizi rīki sanitizē metadatus kā daļu no procesa. Vizuālie pārklājuma rīki tos neskar.

Juridiskās sekas

Sekas ir atkarīgas no konteksta. Precedents nav labs nevienam, kurš izmanto tikai vizuālos pārklājumus.

Federālās tiesas. Federālo civiltiesvedības noteikumu 5.2(e) pants prasa, lai iesniegtajos dokumentos tiktu noņemti specifiski identifikatori. Tiesas ir uzlikušas naudassodus, aizliegumus iesniegt dokumentus un bāra novirzijumus par šādām nepilnībām.

FOIA strīdi. Aģentūras, kas uzklāj vizuālos pārklājumus virs atbrīvotās informācijas, joprojam var likt šo informāciju izvilkt. Tiesas ir likusas patiesi izpaust šādos gadijumos.

Nacionālā drošība. Personāls, kas nosaukts caur noplūdušiem failiem, saskaras ar dokumentētiem drošības riskiem. Atklāšana pārsniedz apkaunojumu.

GDPR un HIPAA. Izvilkjami personas dati ir paziņojams pārkāpums. GDPR 33. pants un HIPAA Pārkāpumu paziņošanas noteikums abi attiecas.

Piecminūšu pārbaude pirms iesniegšanas

Šis kontrolsaraksts pilnīgi novērš vizuālā pārklājuma risku. Tas aizņem mazāk nekā piecas minūtes uz dokumentu.

  1. Izmantojiet satura slāņa rīku. Neizmantojiet zīmēšanas vai anotācijas rīku.
  2. Eksportējiet uz jaunu PDF. Nerakstiet pār oriģinālu.
  3. Atveriet jauno failu svaigā skatītājā.
  4. Atlasīt visu → Kopēt → Ielīmēt vienkāršā teksta redaktorā.
  5. Meklējiet zināmu frāzi no sleptās daļas.
  6. Atrasts? Sāciet no jauna ar pareizo rīku.
  7. Pārbaudiet PDF rekvizītus: Autors, Veidotājs, Temats, Atslēgvārdi.
  8. Pārbaudiet, vai nav iegultu sīktēlu, kas rāda dokumentu pirms apstrādes.
  9. Iesniedziet verificēto dokumentu.

Piecas minūtes šeit maksā daudz mazāk nekā neveiksmīgas redakcijas pieteikuma aizstāvēšana federālā tiesneša priekšā.

Saistīts: Epsteina lietas redakcijas neveiksme izskaidrota — pilns 2025. gada decembra incidenta apraksts.

Skatiet arī: AI koda palīgi un PII noplūdes ražošanā — atšķirīga noplūdes vieta, viena un tā pati mācība.

anonym.legal nodrošina automatizētu teksta slāņa verificēšanu organizācijām, kas apstrādā jutīgus dokumentus.

Avoti

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.