By · Last updated 2026-06-05

Späť na blogPrávna Technológia

E-Discovery so zmiesanymi formatmi: Medzera v sulade

Produccie v e-discovery a DSAR GDPR zahrnuju PDF subory, dokumenty Word, Excel a exporty JSON. Pouzivanie roznych nastrojov pre kazdy format vytvara medzery v konzistentnosti, ktore.

June 5, 20267 min čítania
e-discoverymixed formatDSAR compliancelegal redactiondocument production

E-Discovery so zmiesanymi formatmi: Zatkvorenie medzery v sulade

Prichodzi poziadavka na producciu dokumentov. Sada zahrnuje pat formatov: zmluvy PDF, dokumenty Word, tabulkove subory Excel, exporty CSV a logy JSON. Kazdy format potrebuje iný nastroj. To je problem.

Sprava Everlaw o e-discovery z roku 2025 zistila, ze pravnicke timy pouzivaju v priemere 3,2 nastroja pre produccie so zmiesanymi formatmi. Operacne naklady su vysoke. Riziko nedodrziavania predpisov je este vysssie.

Pozrite si nasu prirucku k pravnemu sulaadu a bezpecnostne postupy pre to, ako spravujeme produccie dokumentov.

Preco fragmentacia nastrojov vytvara medzery

Rozne nastroje znamenaju rozne standardy. Nasleduju tri zranitelnosti.

Pokrytie entit sa lisi podla nastrojov. Adobe Acrobat hlada textove retazce, ktore zadavate rucne. Sam od seba entity nedetekuje. Makro Word moze zachytit mena a emaily. Pravdepodobne prehliadne viac ako 280 inych typov entit. Excel nahradit-a-najst zachyti iba to, co ste napísali. Ten isty RCP v PDF a v Excelovom subore moze dostat odlisne zaobchadzanie od roznych nastrojov.

Auditove stopy sa rozdelia. Kazdy nastroj zaznamenava vlastne akcie - alebo vubec nic. DPA sa moze pytat, ako boli najdene a spravene vsetky osobne udaje. Tri oddelene logy z troch nastrojov je slaba odpoved.

Nastavenia casom kolisaju. Sada pravidiel redakcie PDF z pred siastich mesiacov nemusí zodpovedatmakru Word aktualizovanemu minuly tyzden. Medzera zostane skryta, kym ju neodhalí chyba v produkcii.

Suby sa touto problemom zaobevali. Sankcie za chyby v e-discovery citovali nekonzistentne standardy napriec typmi dokumentov v jednej produkcii. Sudy ocakavaju systematicky proces. Nastroje specificke pre format proti tomu pracuju.

Poziadavka na konzistentnost v DSAR

GDPR DSAR maju zabudovanu poziadavku na konzistentnost v zakone.

Clanok 15 vyzaduje, aby dotknuty subjekt dostal informacie o vsetkych uchovanich osobnych udajoch. Nie o vsetkych osobnych udajoch v PDF a vacsine v dokumentoch Word. Vsetkych.

Usmernenie ICO k DSAR je v tomto bode jasne. Organizacie musia aplikovat systematicky pristup napriec vsetkymi systemami a formatmi. Je vyzadovana konzistentna metodologia. Nastroje specificke pre format s roznymi standardmi nespinaju tuto latku.

Ked DPA vysetruje staznost na DSAR, vyvstava styri otazky:

  1. Aky process nasiel vsetky osobne udaje?
  2. Ake nastroje spracovavali ktore typy dokumentov?
  3. Ake typy entit boli hladane v kazdom formate?
  4. Aka auditova stopa dokazuje uplnost?

Oddelene nastroje s oddelenymi logmi nevedia cisto odpovedat na otazky 3 a 4.

Vyhoda zjednoteného engine

Zjednoteny engine spusta rovnaku detekenu logiku na kazdom formate. Nasleduju styri vyhody.

Konzistentne pokrytie entit. Predvolba s 32 typmi entit spracovava PDF, DOCX, XLSX a CSV rovnakym sposobom. RCP v Exceli dostane rovnaky prah spolahlivosti ako RCP v PDF.

Jedna auditova stopa. Jeden log pokryva vsetky subory v davke. Ukazuje nazov suboru, typ, detekrovane entity, hodnoty spolahllivosti a vykonane akcie. Jeden dokument dokazuje suland pre celu producciu.

Referencna integrita. Povedzme, ze "Jana Novakova" sa objavuje v zmluve PDF, liste Word a zazname Excel. Rovnaky token - PERSON_0001 - nahradi jej meno vo vsetkych troch. Dotknuty subjekt moze sledovat svuj zaznam cez celu producciu.

Jednoduchsi pracovny tok. Prehodite 15 suborov s roznymi formatmi do jednej davky. Aplikujte jednu predvolbu. Ziskate 15 anonymizovanych vystupov a jednu auditovu spravu. Tri separatne pracovne toky s nastrojmi sa zruju do jedneho.

Viac o tom, ako predvolby funguju v davkovo spracovavanych ulohach, najdete v nasej prirucke o davkovom spracovani GDPR DSAR vo velkom meradle.

Federalny FOIA: Rovnaky problem vo vacsim meradle

Americke federalne agentury celie vyzve so zmiesanymi formatmi vo vacsich objemoch.

Poziadavky FOIA zahrnuju exporty z legacy mainframe, moderne dokumenty Word, archivy skenovanych PDF a exporty databaz CSV a JSON. Ziadna agentura nepouziva jeden format.

DOJ aj HHS pilotovaly automatizovane systemy redakcie. Manualne spracovanie viacerych formatov nescaluje na ich objemy poziadaviek. Kazdy pilot mal rovnaku zakladnu poziadavku: jeden standard oslobodenia napriec vsetkymi formatmi. Vyzadovana bola tiez zdokumentovana auditova stopa.

Rovnaky princip plati mimo federalnej vlady. Akakolvek organizacia s potrebami dodrziavania predpisov pre viacere formaty potrebuje to iste. Jeden standard. Jedna auditova stopa. To je zaklad obhajitelnych zaznamov o sulade.

Pripadova studia z pravnicke firmy

Stredne velka pravnicka firma spravovala odpovede GDPR DSAR pre podnikove klientov.

Pred zjednotenim firma pouzivala styri rozne nastroje. Adobe Acrobat spracovavat PDF. Makro Word spracovavalo DOCX, pokryvajuc iba mena a emaily. Excel nahradit-a-najst spracovavalo XLSX. Exporty CSV sli cez manualnu kontrolu. Kazde DSAR trvalo 8-12 hodin. Rovnakym sposobom boli napriec vsetkymi formatmi kontrolovane iba 2-3 typy entit.

Po zjednoteni zjednoteny engine spracovavat vsetky formaty v jednej davke. Predvolba: "DSAR EU Jednotlivec." Engine kontroloval 32 typov entit rovnakym sposobom napriec kazdym formatom. Kazde DSAR trvalo menej ako hodinu. Jedna auditova sprava isla DPO na schvalenie.

Firma teraz moze dokazat konzistentne pokrytie entit napriec kazdym typom dokumentu v produkcii DSAR. Jeden auditovy dokument pokryva kazdu odpoved. Cas klesol z 8-12 hodin na menej ako hodinu. To je vyznamna operacna zmena. Tento prechod premenil dodrzavanie predpisov DSAR na skalovatellnu sluzbu, ktoru mohla firma ponukat klientom.

Suvisiace: fragmentacia formatov dokumentov a anonymizacia OOU.

Zaver

Fragmentacia formatov je zodpovednostou za suland. Rozne nastroje znamenaju rozne standardy. Rozne standardy vytvaraju auditove medzery. Auditove medzery prinasaju expozuciu regulacoram.

Zjednoteny engine to opravuje pri prameni. Jeden standard detekcie. Jedna auditova stopa. Jeden pracovny tok - pre kazdy format.

Zdroje

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.