By · Last updated 2026-06-05

Tilbage til BlogJuridisk Teknologi

Blandet format e-discovery: Compliance-gabet

E-discovery-produktioner og GDPR DSAR'er spænder over PDF'er, Word-dokumenter, Excel og JSON-eksporter. Brug af forskellige værktøjer til hvert format skaber konsistensgab.

June 5, 20267 min læsning
e-discoverymixed formatDSAR compliancelegal redactiondocument production

Blandet format e-discovery: Lukning af compliance-gabet

En anmodning om dokumentproduktion ankommer. Sættet spænder over fem formater: PDF-kontrakter, Word-dokumenter, Excel-regneark, CSV-eksporter og JSON-logfiler. Hvert format kræver et forskelligt værktøj. Det er problemet.

En 2025 Everlaw e-discovery-rapport fandt, at juridiske teams i gennemsnit bruger 3,2 værktøjer til produktioner med blandede formater. De operationelle omkostninger er høje. Compliance-risikoen er højere.

Se vores juridiske compliance-oversigt og sikkerhedspraksis for, hvordan vi håndterer dokumentproduktioner.

Hvorfor værktøjsfragmentering skaber gab

Forskellige værktøjer betyder forskellige standarder. Tre sårbarheder følger.

Enhedsdækning varierer efter værktøj. Adobe Acrobat søger efter tekststrenge, du indtaster manuelt. Det registrerer ikke selv enheder. En Word-makro kan fange navne og e-mails. Den overser sandsynligvis 280+ andre enhedstyper. Excel find-og-erstat fanger kun det, du tastede ind. Det samme CPR-nummer i en PDF og en Excel-fil kan få forskellig behandling fra forskellige værktøjer.

Revisionslogfiler splittes ad. Hvert værktøj logfører sine egne handlinger — eller slet ingen. En DPA kan spørge, hvordan alle persondata blev fundet og håndteret. Tre separate logfiler fra tre værktøjer er et svagt svar.

Indstillinger driver med tiden. PDF-redigeringsreglerne fra for seks måneder siden matcher måske ikke Word-makroen, der blev opdateret i sidste uge. Gabet forbliver skjult, indtil en produktionsfejl afslører det.

Domstole har behandlet dette problem. Sanktioner for e-discovery-fejl har citeret inkonsistente standarder på tværs af dokumenttyper i en enkelt produktion. Domstole forventer en systematisk proces. Formatspecifikke værktøjer arbejder imod det.

DSAR-konsistenskravet

GDPR DSAR'er har et konsistenskrav indbygget i loven.

Artikel 15 kræver, at den registrerede får oplysninger om alle persondata, der er gemt. Ikke alle persondata i PDF'er og de fleste i Word-dokumenter. Alle.

ICO's DSAR-vejledning er klar på dette punkt. Organisationer skal anvende en systematisk tilgang på tværs af alle systemer og formater. Konsistent metodologi er påkrævet. Formatspecifikke værktøjer med forskellige standarder opfylder ikke dette krav.

Når en DPA undersøger en DSAR-klage, dukker fire spørgsmål op:

  1. Hvilken proces fandt alle persondata?
  2. Hvilke værktøjer behandlede hvilke dokumenttyper?
  3. Hvilke enhedstyper blev søgt i hvert format?
  4. Hvilken revisionslog beviser fuldstændighed?

Separate værktøjer med separate logfiler kan ikke besvare spørgsmål 3 og 4 rent.

Fordelene ved en samlet motor

En samlet motor kører den samme detektionslogik på alle formater. Fire fordele følger.

Konsistent enhedsdækning. En forudsætning med 32 enhedstyper behandler en PDF, DOCX, XLSX og CSV på samme måde. CPR-nummeret i Excel får den samme konfidenstærskel som CPR-nummeret i PDF'en.

Ét revisionsnotat. Ét log dækker alle filer i en batch. Det viser filnavn, type, registrerede enheder, konfidensværdier og trufne handlinger. Ét dokument beviser compliance for hele produktionen.

Referentiel integritet. Sig "Sarah Johnson" optræder i en PDF-kontrakt, et Word-brev og en Excel-post. Det samme token — PERSON_0001 — erstatter hendes navn i alle tre. Den registrerede kan spore deres post på tværs af hele produktionen.

Enklere arbejdsgang. Drop 15 filer i blandede formater i én batch. Anvend én forudsætning. Få 15 anonymiserede outputs og én revisionsrapport. Tre separate værktøjsworkflows kollapser til ét.

For mere om, hvordan forudsætninger gælder på tværs af batch-job, se vores guide til GDPR DSAR-batchbehandling i stor skala.

Federal FOIA: Det samme problem i stor skala

Amerikanske føderale agenturer står over for den blandede-format-udfordring i højere volumen.

FOIA-anmodninger spænder over ældre mainframe-eksporter, moderne Word-dokumenter, scannede PDF-arkiver og CSV- og JSON-databaseeksporter. Intet agentur bruger ét format.

DOJ og HHS har begge pilottestet automatiserede redigeringssystemer. Manuel multiformat-behandling skalerer ikke til deres anmodningsvolumener. Hvert pilotprojekt havde det samme kernekrav: én fritagelsesstandard på tværs af alle formater. En dokumenteret revisionslog var også påkrævet.

Det samme princip gælder uden for den føderale regering. Enhver organisation med multiformat-compliance-behov kræver det samme. Én standard. Ét revisionsnotat. Det er grundlaget for forsvarlige compliance-optegnelser.

Advokatfirma-casestudie

Et mellemstort advokatfirma håndterede GDPR DSAR-svar for enterprise-klienter.

Før samling brugte firmaet fire forskellige værktøjer. Adobe Acrobat håndterede PDF'er. En Word-makro håndterede DOCX, der kun dækkede navne og e-mails. Excel find-og-erstat håndterede XLSX. CSV-eksporter gik igennem manuel gennemgang. Hvert DSAR tog 8–12 timer. Kun 2–3 enhedstyper blev kontrolleret på samme måde på tværs af alle formater.

Efterfølgende håndterede en samlet motor alle formater i én batch. Forudsætningen: "DSAR EU Individ." Motoren kontrollerede 32 enhedstyper på samme måde på tværs af hvert format. Hvert DSAR tog under én time. Én revisionsrapport gik til DPO'en til godkendelse.

Firmaet kan nu bevise konsistent enhedsdækning på tværs af alle dokumenttyper i en DSAR-produktion. Ét revisionsdokument dækker hvert svar. Tid faldt fra 8–12 timer til under én time. Det er en betydelig operationel ændring. Skiftet gjorde DSAR-compliance til en skalerbar tjeneste, som firmaet kunne tilbyde klienter.

Relateret: dokumentformatfragmentering og PII-anonymisering.

Konklusion

Formatfragmentering er en compliance-forpligtelse. Forskellige værktøjer betyder forskellige standarder. Forskellige standarder skaber revisionsgab. Revisionsgab medfører tilsynsmyndighedseksponering.

En samlet motor løser dette ved kilden. Én detektionsstandard. Ét revisionsnotat. Én arbejdsgang — for alle formater.

Kilder

Klar til at beskytte dine data?

Begynd at anonymisere PII med 285+ enhedstyper på tværs af 48 sprog.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.