anonym.legal

By · Last updated 2026-06-05

Terug naar BlogJuridische Technologie

E-Discovery In Gemengde Formaten: Compliance-Lacune

E-discovery-producties en AVG DSAR's omvatten pdf's, Word-documenten, Excel en JSON-exports. Verschillende tools per formaat creëren consistentieproblemen die compliancerisico's veroorzaken.

June 5, 20267 min lezen
e-discoverymixed formatDSAR compliancelegal redactiondocument production

E-Discovery In Gemengde Formaten: De Compliance-Lacune Dichten

Er arriveert een verzoek om documentproductie. De set omvat vijf formaten: pdf-contracten, Word-documenten, Excel-spreadsheets, CSV-exports en JSON-logs. Elk formaat heeft een andere tool nodig. Dat is het probleem.

Een e-discovery-rapport van Everlaw uit 2025 constateerde dat juridische teams gemiddeld 3,2 tools gebruiken voor producties in gemengde formaten. De operationele kosten zijn hoog. Het compliancerisico is hoger.

Zie ons wettelijk complianceoverzicht en beveiligingspraktijken voor hoe wij documentproducties verwerken.

Waarom Toolfragmentatie Lacunes Creëert

Verschillende tools betekenen verschillende normen. Drie kwetsbaarheden volgen hieruit.

Entiteitsdekking varieert per tool. Adobe Acrobat zoekt naar tekstreeksen die u handmatig invoert. Het detecteert geen entiteiten op zichzelf. Een Word-macro kan namen en e-mails onderscheppen. Het mist waarschijnlijk 280+ andere entiteitstypen. Excel Zoeken-en-Vervangen onderschept alleen wat u heeft ingetypt. Hetzelfde BSN in een pdf en een Excel-bestand kan door verschillende tools anders worden behandeld.

Auditsporen vallen uiteen. Elke tool logt zijn eigen acties — of helemaal niets. Een AVG-toezichthouder kan vragen hoe alle persoonsgegevens zijn gevonden en verwerkt. Drie afzonderlijke logs van drie tools is een zwak antwoord.

Instellingen driften in de loop van de tijd. De pdf-redactieregel van zes maanden geleden komt mogelijk niet overeen met de vorige week bijgewerkte Word-macro. De kloof blijft verborgen totdat een productiefout dit onthult.

Rechtbanken hebben dit probleem aangepakt. Sancties voor e-discovery-fouten hebben inconsistente normen over documenttypen in één productie aangehaald. Rechtbanken verwachten een systematisch proces. Formaat-specifieke tools werken hiertegen in.

De Consistentievereiste Voor DSAR

AVG DSAR's hebben een ingebouwde consistentieregel.

Artikel 15 vereist dat de betrokkene informatie ontvangt over alle gehouden persoonsgegevens. Niet alle persoonsgegevens in pdf's en de meeste in Word-documenten. Alle.

De ICO DSAR-leidraad is hierover duidelijk. Organisaties moeten een systematische aanpak toepassen op alle systemen en formaten. Consistente methodologie is vereist. Formaat-specifieke tools met verschillende normen halen deze lat niet.

Wanneer een toezichthouder een DSAR-klacht onderzoekt, komen vier vragen aan bod:

  1. Welk proces heeft alle persoonsgegevens gevonden?
  2. Welke tools hebben welke documenttypen verwerkt?
  3. Welke entiteitstypen zijn in elk formaat doorzocht?
  4. Welk auditspoor bewijst volledigheid?

Afzonderlijke tools met afzonderlijke logs kunnen vragen 3 en 4 niet helder beantwoorden.

Het Voordeel Van Een Unified Engine

Een unified engine voert dezelfde detectielogica uit op elk formaat. Vier voordelen volgen hieruit.

Consistente entiteitsdekking. Een preset met 32 entiteitstypen verwerkt een pdf, DOCX, XLSX en CSV op dezelfde manier. Het BSN in Excel krijgt dezelfde betrouwbaarheidsdrempel als het BSN in de pdf.

Één auditspoor. Één log dekt alle bestanden in een batch. Het toont bestandsnaam, type, gedetecteerde entiteiten, betrouwbaarheidswaarden en ondernomen acties. Één document bewijst compliance voor de hele productie.

Referentiële integriteit. Stel dat "Sarah Johnson" verschijnt in een pdf-contract, een Word-brief en een Excel-record. Hetzelfde token — PERSON_0001 — vervangt haar naam in alle drie. De betrokkene kan hun record traceren door de volledige productie.

Eenvoudigere workflow. Zet 15 bestanden van gemengde formaten in één batch. Pas één preset toe. Ontvang 15 geanonimiseerde uitvoers en één auditrapport. Drie afzonderlijke toolworkflows vallen samen in één.

Voor meer over hoe presets worden toegepast op batchjobs, zie onze gids over GDPR DSAR-batchverwerking op schaal.

Federale FOIA: Hetzelfde Probleem Op Grotere Schaal

US federale agentschappen staan voor de uitdaging van gemengde formaten op groter volume.

FOIA-verzoeken omvatten legacy mainframe-exports, moderne Word-documenten, gescande pdf-archieven en CSV- en JSON-database-exports. Geen agentschap gebruikt één formaat.

Zowel het DOJ als HHS hebben geautomatiseerde redactiesystemen getest. Handmatige verwerking van meerdere formaten schaalt niet op bij hun aanvraagvolumes. Elk pilotproject had dezelfde kernvereiste: één vrijstellingsnorm over alle formaten. Een gedocumenteerd auditspoor was ook vereist.

Hetzelfde beginsel geldt buiten de federale overheid. Elke organisatie met multi-format compliance-behoeften heeft hetzelfde nodig. Één norm. Één auditspoor. Dat is de basis van aantoonbare compliancedossiers.

Casestudy Advocatenkantoor

Een middelgroot advocatenkantoor behandelde AVG DSAR-reacties voor zakelijke cliënten.

Vóór unificatie gebruikte het kantoor vier verschillende tools. Adobe Acrobat verwerkte pdf's. Een Word-macro verwerkte DOCX, alleen namen en e-mails. Excel Zoeken-en-Vervangen verwerkte XLSX. CSV-exports werden handmatig beoordeeld. Elke DSAR kostte 8–12 uur. Slechts 2–3 entiteitstypen werden op dezelfde manier gecontroleerd over alle formaten.

Daarna verwerkte een unified engine alle formaten in één batch. De preset: "DSAR EU Individu." De engine controleerde 32 entiteitstypen op dezelfde manier over elk formaat. Elke DSAR kostte minder dan één uur. Één auditrapport ging naar de DPO ter goedkeuring.

Het kantoor kan nu consistente entiteitsdekking bewijzen over elk documenttype in een DSAR-productie. Één auditdocument dekt elke reactie. De tijd daalde van 8–12 uur naar minder dan één uur. Dat is een significante operationele verandering. De verschuiving maakte DSAR-compliance een schaalbare dienst die het kantoor aan cliënten kon aanbieden.

Gerelateerd: documentformaat-fragmentatie en PII-anonimisering.

Conclusie

Formaat-fragmentatie is een complianceaansprakelijkheid. Verschillende tools betekenen verschillende normen. Verschillende normen creëren auditlacunes. Auditlacunes brengen toezichthouderblootstelling.

Een unified engine repareert dit aan de bron. Één detectienorm. Één auditspoor. Één workflow — voor elk formaat.

Bronnen

Klaar om uw gegevens te beschermen?

Begin met het anonimiseren van PII met 285+ entiteitstypen in 48 talen.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.