By · Last updated 2026-05-26

Zpět na blogPrávní technologie

Automatizovaná detekce PII snižuje náklady na e-discovery

Anonymizace PII vedená advokáty v e-discovery stojí 1–2 USD za stránku. Soudní případ s 50 000 dokumenty generuje více než 375 000 USD nákladů pouze na anonymizaci. Automatizovaná detekce snižuje čas advokátů o 70 %.

May 26, 20268 min čtení
e-discoverylegal redactionlitigation costslaw firm technologydocument review

Snižování nákladů na e-discovery: Automatizovaná detekce PII snižuje právní účty o 70 %

Aktualizováno pro rok 2026

Práce advokáta je nejdražší části e-discovery. Hledání a skrývání osobních dat stojí 1–2 USD za stránku. Případ s 50 000 dokumenty má přibližně 250 000 stránek. Při 1,50 USD za stránku to je 375 000 USD. A to jen za screening.

Klienti to vědí. Tlačí na účty. Firmy musí snižovat náklady bez ztráty kvality.

Používání mladších zaměstnanců za nižší sazby neřeší základní problém. Dokument, jehož screening trvá 15 minut, trvá 15 minut při jakékoli fakturační sazbě.

Automatizovaný pre-screening to mění.

Jak advokáti nyní tráví čas

V normálním průběhu e-discovery provádí recenzent pět věcí:

  1. Otevře dokument
  2. Přečte ho, aby našel osobní data chráněná předpisy na ochranu soukromí
  3. Anonymizuje každou nalezenou položku
  4. Zaznamená důvod každé anonymizace
  5. Přejde na další dokument

Kroky 2 a 3 zabírají přibližně 70 % času na dokument. Krok 4 potřebuje advokáta. Krok 5 je jen pracovní postup.

Pro dokumenty s malým počtem nebo žádnými citlivými položkami mohou kroky 2–3 provést nástroje během sekund. Advokát zkontroluje výstup a zpracuje okrajové případy.

Pracovní postup pre-screeningu

Solid pre-screeningový postup má tři fáze.

Fáze 1: Hromadné nahrání

Nahrajte všechny dokumenty do dávkového zpracování. Pro 5 000 dokumentů:

  • Nahrání: 15–30 minut
  • Zpracování: 2–4 hodiny, může běžet přes noc
  • Výstup: označené dokumenty plus zpráva uvádějící, které soubory mají citlivá data a jakých typů

Fáze 2: Třídění

Zkontrolujte zprávu a rozdělte dokumenty do tří skupin:

  • Nenalezeny žádné citlivé položky: pošlete klientovi. Není potřeba žádný čas advokáta.
  • Standardní jasné položky (e-mail, telefon): zkontrolujte výstup, použijte anonymizace, zaznamenejte důvod.
  • Označeno pro výjimku: advokát zkontroluje tyto položky v kontextu.

Pro běžný firemní případ:

  • 20–30 % dokumentů nevyžaduje žádnou anonymizaci
  • 50–60 % má standardní položky, kde je nástroj přesný
  • 10–20 % potřebuje přezkum advokáta (jména veřejných osob, zdravotní záznamy, kontroly privilegovaných informací)

Fáze 3: Přezkum výjimek

Advokáti zpracovávají pouze 10–20% sadu výjimek. V případu s 5 000 dokumenty to je 500–1 000 souborů místo 5 000. Čas advokáta klesá o 70–80 %.

Proč to obstojí u soudu

E-discovery lze napadnout. Jakákoli metoda anonymizace musí být solidní.

Stejná pravidla pokaždé: Nástroje aplikují stejná nastavení na každý dokument. Ruční přezkum není stejný. Recenzent zpracovává dokument 500 jinak než dokument 1 po čtyřech hodinách práce.

Jasné záznamy: Zpracovatelské protokoly ukazují, co bylo nalezeno, jaká metoda byla použita a kdy běžela. Tím se vytváří auditní stopa. Když protistrana vznese námitky, jasný protokol podporuje obranu.

Namátkové kontroly: Otestujte nástroj na vzorku před úplným zpracováním. Uložte tyto výsledky. To ukazuje, že byla věnována péče.

Standard „přiměřené péče“: Soudy aplikující Federální pravidlo občanského soudního řádu 26 sledují, zda strany věnovaly „přiměřenou péči“ při produkci. Nástroj s jasnou metodou a vzorkovým testem splňuje tuto laťku. Ad-hoc ruční práce bez záznamů ji často nesplňuje.

Srovnání nákladů: Jeden reálný případ

Příklad: Případ diskriminace v zaměstnání s 50 000 dokumenty

Pouze ruční přezkum:

  • 50 000 dokumentů × 5 stránek = 250 000 stránek
  • 250 000 stránek × 1,50 USD = 375 000 USD
  • Časový rámec: 8–12 týdnů, pětičlenný tým

Přezkum s pomocí nástroje plus práce s výjimkami:

  • 30 % bez citlivých dat (15 000 souborů): předat klientovi — 0 USD
  • 60 % standardních položek (30 000 souborů): kontrola za 3–5 min na soubor vs. 15–30 min — 90 000–150 000 USD
  • 10 % výjimek (5 000 souborů): úplný přezkum za 1,50 USD/stránku — 37 500 USD
  • Celkem: přibližně 130 000–190 000 USD

Úspory: 185 000–245 000 USD, snížení o 49–65 % pouze v tomto případě.

Co právní firmy potřebují k nastavení

Firmy začínající s tímto přístupem potřebují mít několik věcí na místě.

Podpora formátů souborů: Případy zahrnují textové PDF, skenované PDF, soubory Word, e-mailové soubory (MSG, EML) a tabulky. Textové dokumenty fungují s vysokou přesností. Skenované PDF potřebují nejprve OCR.

Nastavení ochranného příkazu: Věci s ochrannými příkazy, které jmenují konkrétní typy dat, potřebují vlastní nastavení odpovídající přesným slovům příkazu.

Předvolby pro každý případ: Ukládejte nastavení podle typu případu — zaměstnanost, zdravotnictví, finance. Používejte stejná nastavení napříč podobnými případy.

Propojení platformy: Výstup může jít do Relativity, Everlaw nebo Nuix pro přezkum advokátem. Soubory nebo export metadat se zapojí do stávajících pipeline.

Pro kontext o tom, jak se nástroje srovnávají se standardní anonymizací, viz náš článek o přesnosti AI v práci s právními dokumenty. Pro informace o tom, jak soudy nakládají se selháními e-discovery, viz náš příspěvek o přílišné anonymizaci v e-discovery a sankcích.

Závěr

Účet za e-discovery ve výši 375 000 USD není pevně daný. Je to cena ručního procesu ve velkém měřítku. Snížení času advokáta o 70 % znamená nižší účty klientů, lepší cenování případů a rychlejší výstup.

Pro firmy soutěžící v právní technologii — nyní běžný požadavek klientů — je zdokumentovaná automatizovaná detekce skutečnou výhodou. Pro klienty spravující rozpočty e-discovery je to nutnost.

Zdroje

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.