By · Last updated 2026-06-05

Tilbake til BloggJuridisk Teknologi

E-Discovery med blandede formater: Etterlevelseshullet

E-discovery-produksjoner og GDPR-DSAR-er spenner over PDF-er, Word-dokumenter, Excel og JSON-eksporter. Bruk av forskjellige verktoy for hvert format skaper konsistenshuller som kan bety regulatorisk eksponering.

June 5, 20267 min lesing
e-discoverymixed formatDSAR compliancelegal redactiondocument production

E-Discovery med blandede formater: Lukke etterlevelseshullet

En dokumentproduksjonsforesporse ankom. Settet spenner over fem formater: PDF-kontrakter, Word-dokumenter, Excel-regneark, CSV-eksporter og JSON-logger. Hvert format trenger et annet verktoy. Det er problemet.

En Everlaw e-discovery-rapport fra 2025 fant at juridiske team bruker et gjennomsnitt pa 3,2 verktoy for produksjoner med blandede formater. Den operasjonelle kostnaden er hoy. Etterlevelsesrisikoen er hoyere.

Se var juridiske etterlevselsoversikt og sikkerhetspraksis for hvordan vi handterer dokumentproduksjoner.

Hvorfor verktoysfragmentering skaper hull

Forskjellige verktoy betyr forskjellige standarder. Tre sarbarheter folger.

Enhetsdekning varierer etter verktoy. Adobe Acrobat soker etter tekststrenger du angir manuelt. Det detekterer ikke enheter pa egen hand. Et Word-makro kan fange navn og e-poster. Det misser sannsynligvis 280+ andre enhetstyper. Excel sokk-og-erstatt fanger bare det du tastet inn. Det samme personnummeret i en PDF og en Excel-fil kan fa forskjellig behandling fra forskjellige verktoy.

Revisjonsspor spres fra hverandre. Hvert verktoy logger sine egne handlinger — eller ingenting i det hele tatt. En DPA kan sporr e om hvordan alle personopplysninger ble funnet og handtert. Tre separate logger fra tre verktoy er et svakt svar.

Innstillinger driver over tid. Regelsettet for PDF-sladding fra for seks maneder siden kan ikke stemme med Word-makroen som ble oppdatert forrige uke. Hullet forblir skjult til en produksjonsfeil avslorer det.

Domstoler har tatt opp dette problemet. Sanksjoner for e-discovery-feil har henvist til inkonsistente standarder pa tvers av dokumenttyper i en enkelt produksjon. Domstoler forventer en systematisk prosess. Formatspesifikke verktoy jobber mot det.

DSAR-konsistenskravet

GDPR DSAR-er har et konsistenskrav innebygd i loven.

Artikkel 15 krever at den registrerte far informasjon om alle personopplysninger som holdes. Ikke alle personopplysninger i PDF-er og de fleste i Word-dokumenter. Alle.

ICOs DSAR-veiledning er klar pa dette punktet. Organisasjoner ma anvende en systematisk tilnarming pa tvers av alle systemer og formater. Konsistent metodologi er pakrevd. Formatspesifikke verktoy med forskjellige standarder oppfyller ikke denne terskelen.

Nar en DPA undersoker en DSAR-klage, oppstar fire sporsmal:

  1. Hvilken prosess fant alle personopplysninger?
  2. Hvilke verktoy behandlet hvilke dokumenttyper?
  3. Hvilke enhetstyper ble sokt i hvert format?
  4. Hvilket revisjonsspor beviser fullstendighet?

Separate verktoy med separate logger kan ikke besvare sporsmal 3 og 4 pa en ryddig mate.

Fordelen med en enhetlig motor

En enhetlig motor kjorer den samme deteksjonslogikken pa hvert format. Fire fordeler folger.

Konsistent enhetsdekning. En forhansinnstilling med 32 enhetstyper behandler en PDF, DOCX, XLSX og CSV pa samme mate. Personnummeret i Excel far den samme konfidensterskelen som personnummeret i PDF-en.

Ett revisjonsspor. En logg dekker alle filene i en batch. Den viser filnavn, type, detekterte enheter, konfidensv erdier og handlinger tatt. Ett dokument beviser etterlevelse for hele produksjonen.

Referanseintegritet. Si at "Sara Hansen" vises i en PDF-kontrakt, et Word-brev og en Excel-post. Det samme tokenet — PERSON_0001 — erstatter navnet hennes i alle tre. Den registrerte kan spore sin post pa tvers av hele produksjonen.

Enklere arbeidsflyt. Slipp 15 filer med blandede formater i en batch. Bruk en forhansinnstilling. Fa 15 anonymiserte utdata og en revisjonsrapport. Tre separate verktoy-arbeidsflyter kollapser til en.

For mer om hvordan forhansinnstillinger brukes pa tvers av batch-jobber, se var veiledning om GDPR DSAR batch-behandling i storskala.

Federal FOIA: Det samme problemet i storskala

Amerikas foederale byraer star overfor flerformatutfordringen i hoyere volum.

FOIA-foresporseler spenner over eldre stormaskinseksporter, moderne Word-dokumenter, skannede PDF-arkiver og CSV- og JSON-databaseeksporter. Ingen byr ra bruker ett format.

DOJ og HHS har begge pilotert automatiserte sladdingssystemer. Manuell flerformatbehandling skalerer ikke til foresporselsvolumene deres. Hvert pilotkrav hadde det samme kjernetil kravet: en unntak-standard pa tvers av alle formater. Et dokumentert revisjonsspor var ogsa pakrevd.

Det samme prinsippet gjelder utenfor den foederale regjeringen. Enhver organisasjon med flerformat-etterlevelseskrav trenger det samme. En standard. Ett revisjonsspor. Det er grunnlaget for forsvarlige etterlevselsjournaler.

Advokatkontor-casestudie

Et mellomstort advokatkontor gjennomforte GDPR DSAR-svar for bedriftskunder.

For samling brukte firmaet fire forskjellige verktoy. Adobe Acrobat handterte PDF-er. Et Word-makro handterte DOCX, og dekket bare navn og e-poster. Excel sokk-og-erstatt handterte XLSX. CSV-eksporter gikk gjennom manuell gjennomgang. Hvert DSAR tok 8–12 timer. Bare 2–3 enhetstyper ble sjekket pa samme mate pa tvers av alle formater.

Etterpat handterte en enhetlig motor alle formater i en batch. Forhansinnstillingen: "DSAR EU-individ." Motoren sjekket 32 enhetstyper pa samme mate pa tvers av hvert format. Hvert DSAR tok under en time. En revisjonsrapport gikk til DPO for godkjenning.

Firmaet kan na bevise konsistent enhetsdekning pa tvers av hver dokumenttype i en DSAR-produksjon. Ett revisjonsdokument dekker hvert svar. Tid falt fra 8–12 timer til under en time. Det er en betydelig operasjonell endring. Skiftet gjorde DSAR-etterlevelse til en skalerbar tjeneste firmaet kunne tilby kunder.

Relatert: dokumentformatfragmentering og PII-anonymisering.

Konklusjon

Formatfragmentering er en etterlevelsesforpliktelse. Forskjellige verktoy betyr forskjellige standarder. Forskjellige standarder skaper revisjonshull. Revisjonshull medforer regulatorseksponering.

En enhetlig motor fikser dette ved kilden. En deteksjonsstandard. Ett revisjonsspor. En arbeidsflyt — for hvert format.

Kilder

Klar til å beskytte dataene dine?

Begynn å anonymisere PII med 285+ enhetstyper på 48 språk.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.