By · Last updated 2026-03-12

Späť na blogPrávna Technológia

Sankcie pri e-Discovery: Zlyhania AI redigovania

V prípade Athletics Investment Group vs. Schnitzer Steel (2024) nevhodné redigovanie vyvolalo sankcie pri objavovaní dôkazov. Pri presnosti AI nástrojov iba 22,7 % čelia právne tímy reálnej zodpovednosti.

March 12, 202610 min čítania
e-discovery sanctionsredaction liabilityAI redaction precisiondocument reviewlegal technology

Aktualizované pre rok 2026

Dve spôsoby, akými redigovanie zlyháva

Právne tímy čelia dvom scenárom zlyhania. Oba vytvárajú reálnu zodpovednosť.

Nedostatočné redigovanie odhaľuje privilegované údaje alebo osobné informácie, ktoré musia zostať skryté. Strana zverejní materiál, na ktorého ochranu mala právo - a často povinnosť.

Nadmerné redigovanie skryje fakty, ktoré má protistrana právo vidieť. Súdy to považujú za obštrukciu. Je to porušenie povinnosti objavenia dôkazov podliehajúce sankciám.

AI nástroje, ktoré uprednostňujú úplnosť pred presnosťou, spôsobujú druhý problém zámerným dizajnom. AI engine, ktorý začierňuje 80 % dokumentu, sa vyhne prehliadnutiu čohokoľvek. Výsledok je však nepoužiteľný. Môže tiež vyvolať súdne sankcie.

Obidve scenáre zlyhania vedú na rovnaké miesto: sudca, vysvetlenie a náklady.

Prípad Schnitzer Steel (2024)

Prípad Athletics Investment Group vs. Schnitzer Steel z roku 2024 ukazuje, ako súdy riešia nevhodné zadržiavanie dokumentov.

Jedna strana predložila dokumenty so širokými označeniami. Protistrana namietala. Súd preskúmal materiály. Zistil, že označenia presahujú to, čo zákon dovoľuje.

Výsledok: sankcie podľa Federálneho predpisu o občianskom konaní 37. Predkladajúca strana zaplatila za chybný proces.

Takéto sankcie nie sú nové. Súdy ich používajú roky. Čo robí tento prípad výnimočným, je načasovanie. Prehľad s pomocou AI je teraz bežný v súdnych sporoch. Prípad nastoluje kľúčovú otázku: overili právne tímy presnosť svojich AI nástrojov pred ich použitím v produkcii?

Odpoveď záleží. Nástroj so slabou presnosťou bude označovať príliš veľa. Advokát, ktorý sa na neho spolieha bez kontroly, nesie riziko.

Pre úplný rozbor prípadu pozrite analýzu E-Discovery LLC o zadržiavaní na základe relevancie.

Problém presnosti 22,7 %

Presidio je open-source engine na detekciu PII vytvorený spoločnosťou Microsoft. Je široko používaný v nástrojoch na prehľad dokumentov. Testy na súdnych podaniach a zmluvách mu dávajú mieru presnosti 22,7 %.

Presnosť meria, ako často je pozitívna vlajka správna. Pri 22,7 % je asi 77 zo 100 vlajok falošne pozitívnych. Tieto položky nie sú citlivé podľa žiadneho platného štandardu.

Pre e-discovery je matematika priama. Súbor 10 000 dokumentov spracovaných touto sadzbou bude mať tisíce neopodstatnených označení. Predkladajúca strana čelí rovnakému riziku ako žalovaný v prípade Schnitzer Steel: spochybnená produkcia, súdny prehľad a možné sankcie.

Táto číslica platí pre predvolené nastavenie Presidio na obsahu právnych firiem. Nie všetky AI nástroje dosahujú túto úroveň. Ale tento engine je najpoužívanejšou open-source možnosťou v tejto oblasti.

Príčina je štrukturálna. Systémy NLP sa trénujú na všeobecnom texte. Jazyková prax v súdnych sálach je iná. Používa odborné termíny, formáty citácií a pravidlá tvorby, ktoré sa odlišujú od tréningových dát. Nástroj, ktorý funguje dobre na lekárskych záznamoch, môže mať oveľa horšie výsledky pri prepisoch výpovede.

Čo ukazujú dáta o používaní AI

Tu je druhý dátový bod: 27,4 % obsahu AI chatbotov je citlivé, podľa nezávislej analýzy podnikového používania AI.

Toto popisuje, čo zamestnanci posielajú počas bežných úloh. Nie údaje, ktoré chceli zdieľať - obsah zahrnutý zo zvyku alebo náhodou. Advokáti používajúci AI na písanie listov, prehľad zmlúv alebo zhrnutie výpovede posielajú citlivý obsah na servery AI ako vedľajší efekt bežnej práce.

Takmer traja z desiatich interakcií zahŕňajú údaje klientov, privilegované informácie alebo prípadovú stratégiu. Tento obsah sa dostane na servery dodávateľa AI v použiteľnej forme, pokiaľ ho nezastavia kontroly.

Pre právne firmy kontrolujúce svoje AI riziko, 27,4 % nie je malý problém. Je to základná sadzba. Takmer tretina používania AI vo firme zahŕňa obsah, ktorý potrebuje ochranu.

Reťazec zodpovednosti

Nadmerné zadržiavanie a úniky údajov AI vytvárajú samostatné, ale prepojené cesty rizika. Obe začínajú rovnakým rozhodnutím: nasadiť AI nástroj bez riadneho hodnotenia.

Cesta objavenia: AI široko označuje obsah -> advokát sa spolieha na výstup bez namátkových kontrol -> produkcia má neopodstatnené označenia -> protistrana namieta -> súd preskúma -> sankcie.

Cesta úniku údajov: Advokát používa AI na prípadovú prácu -> AI prijíma privilegovanú komunikáciu -> dodávateľ AI utrpí narušenie -> údaje klienta sú odhalené -> nasledujú nároky z nedbanlivosti.

Východisko je v oboch prípadoch rovnaké. Firmy nasadzujú AI nástroje bez toho, aby vedeli, čo tieto nástroje skutočne robia. Pre prácu nie sú nastavené žiadne kontroly.

Prehľad zameraný na presnosť pri produkciách

Súdy si pri prehľade sporných označení kladú úzku otázku. Bolo každé z nich podložené privilégiom, pravidlom dôvernosti alebo súdnym príkazom? Súdy sa nepýtajú, či nástroj predkladajúcej strany označil čo najviac.

Označenie bez riadneho základu je porušením povinnosti objavenia dôkazov. Nezáleží na tom, či ho urobil človek alebo AI. Skúmanie sa robí označenie po označení.

Pre advokátov to znamená, že AI nástroje na prehľad musia byť testované na presnosť - podiel vlajok, ktoré sú skutočne privilegované. Nielen úplnosť. Nástroj s 90 % úplnosťou pri presnosti 22,7 % zachytí viac citlivého obsahu. Ale vytvára záťaž pri prehľade pre 77,3 % falošných vlajok. Keď sa tento prehľad nevykoná, nasleduje široké nadmerné zadržiavanie.

Každé označenie v produkcii je tvrdeným nárokom na súd. Hovorí: tento obsah je oprávnene zadržaný. Po prípade Schnitzer Steel musí tento nárok obstáť.

Viac o tom, ako sa nástroje na anonymizáciu líšia od štandardnej detekcie PII, nájdete v našom sprievodcovi presnosťou AI pri prehľade právnych dokumentov. Pre kontext o protokoloch privilégií a AI nástrojoch si pozrite náš článok o advokátsko-klientskom privilégiu a AI.

Zdroje

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.