By · Last updated 2026-03-12

Powrót do blogaTechnologia prawna

Sankcje w e-discovery: kiedy redakcja AI idzie za daleko

W sprawie Athletics Investment Group v. Schnitzer Steel (2024) niewłaściwa redakcja skutkowała sankcjami w postępowaniu odkrywczym. Gdy narzędzia AI osiągają zaledwie 22,7% precyzji, zespoły prawne narażają się na realne ryzyko odpowiedzialności.

March 12, 202610 min czytania
e-discovery sanctionsredaction liabilityAI redaction precisiondocument reviewlegal technology

Aktualizacja 2026

Dwa sposoby, w jakie redakcja zawodzi

Zespoły prawne stoją przed dwoma trybami awarii. Oba generują realne ryzyko odpowiedzialności.

Niedostateczna redakcja ujawnia uprzywilejowane dane lub dane osobowe, które muszą pozostać ukryte. Strona ujawnia materiał, do ochrony którego miała prawo – a często obowiązek.

Nadmierna redakcja ukrywa fakty, do których strona przeciwna ma prawo wglądu. Sądy traktują to jako utrudnianie postępowania. Jest to naruszenie postępowania odkrywczego podlegające sankcjom.

Narzędzia AI, które stawiają recall ponad precyzję, z założenia powodują drugi problem. Silnik AI, który zaciemnia 80% dokumentu, unika pominięcia czegokolwiek. Ale wynik jest bezużyteczny. Może też wywołać sankcje sądu.

Oba tryby awarii prowadzą do tego samego miejsca: sędzia, wyjaśnienia i koszty.

Sprawa Schnitzer Steel (2024)

Sprawa z 2024 roku Athletics Investment Group v. Schnitzer Steel pokazuje, jak sądy traktują niewłaściwe zatrzymywanie dokumentów.

Jedna ze stron przedstawiła dokumenty z szerokimi oznaczeniami. Pełnomocnik strony przeciwnej zakwestionował to. Sąd przejrzał materiały. Stwierdził, że oznaczenia wykraczały poza to, co prawo dopuszcza.

Efekt: sankcje na podstawie Federal Rule of Civil Procedure 37. Strona produkująca zapłaciła za wadliwy proces.

Takie sankcje nie są nowością. Sądy stosują je od lat. Wyróżniające jest tutaj znaczenie czasowe. Przegląd wspomagany przez AI jest teraz powszechny w postępowaniach sądowych. Sprawa nasuwa kluczowe pytanie: czy zespoły prawne sprawdziły precyzję swoich narzędzi AI przed ich wdrożeniem produkcyjnym?

Odpowiedź ma znaczenie. Narzędzie o niskiej precyzji oznaczy o wiele za dużo. Adwokat, który na nim polega bez weryfikacji, ponosi ryzyko.

Pełną analizę sprawy znajdziesz w analizie E-Discovery LLC dotyczącej zatrzymywania opartego na trafności.

Problem precyzji 22,7%

Presidio to silnik detekcji PII o otwartym kodzie źródłowym zbudowany przez Microsoft. Jest szeroko stosowany w narzędziach do przeglądu dokumentów. Testy na aktach sądowych i umowach dają mu precyzję 22,7%.

Precyzja mierzy, jak często pozytywna flaga jest prawidłowa. Przy 22,7%, około 77 na każde 100 flag to fałszywe alarmy. Te elementy nie są wrażliwe według żadnego obowiązującego standardu.

Dla e-discovery matematyka jest bezpośrednia. Zbiór 10 000 dokumentów przetworzonych przy tym wskaźniku będzie miał tysiące bezzasadnych oznaczeń. Strona produkująca staje w obliczu tego samego ryzyka co pozwana w sprawie Schnitzer Steel: zakwestionowana produkcja, przegląd sądowy i ewentualne sankcje.

Ta liczba dotyczy standardowej konfiguracji Presidio na treściach kancelarii prawnych. Nie wszystkie narzędzia AI działają na tym poziomie. Ale ten silnik jest najszerzej stosowaną opcją open-source w tej dziedzinie.

Przyczyna jest strukturalna. Systemy NLP trenują na ogólnym tekście. Język sądowy jest inny. Używa terminów specjalistycznych, formatów cytowań i zasad redakcji, które odbiegają od danych treningowych. Narzędzie działające dobrze na dokumentacji medycznej może radzić sobie znacznie gorzej na transkryptach przesłuchań.

Co dane o użyciu AI pokazują

Oto drugi punkt danych: 27,4% treści w chatbotach AI jest wrażliwe według niezależnej analizy użycia korporacyjnego AI.

To opisuje, co pracownicy wysyłają podczas normalnych zadań. Nie dane, które zamierzali udostępnić – treść zawarta przez nawyk lub przypadek. Prawnicy używający AI do tworzenia pism, przeglądania umów czy podsumowywania zeznań wysyłają wrażliwe treści na serwery AI jako efekt uboczny normalnej pracy.

Prawie trzy na dziesięć interakcji dotyczy danych klientów, informacji uprzywilejowanych lub strategii sprawy. Ta treść trafia na serwery dostawcy AI w użytecznej formie, chyba że kontrole ją wcześniej zatrzymają.

Dla kancelarii sprawdzających swoje ryzyko AI, 27,4% to nie problem marginalny. To bazowy wskaźnik. Prawie jedna trzecia użycia AI w kancelarii dotyczy treści wymagających ochrony.

Łańcuch odpowiedzialności

Nadmierne zatrzymywanie i wycieki danych AI tworzą oddzielne, ale powiązane ścieżki ryzyka. Obie zaczynają się od tej samej decyzji: wdrożenie narzędzia AI bez właściwej oceny.

Ścieżka discovery: AI szeroko oznacza treści → adwokat polega na wynikach bez wyrywkowej weryfikacji → produkcja ma nieuzasadnione oznaczenia → pełnomocnik strony przeciwnej kwestionuje → sąd przegląda → sankcje.

Ścieżka wycieku danych: Adwokat używa AI do pracy nad sprawą → AI otrzymuje uprzywilejowane komunikaty → dostawca AI doświadcza naruszenia → dane klienta zostają ujawnione → następują roszczenia z tytułu błędów w sztuce.

Punkt wyjścia jest taki sam w obu przypadkach. Kancelarie wdrażają narzędzia AI nie wiedząc, co te narzędzia faktycznie robią. Nie są ustanawiane żadne kontrole dla tej pracy.

Przegląd oparty na precyzji dla produkcji

Sądy zadają wąskie pytanie przy przeglądzie kwestionowanych oznaczeń. Czy każde z nich było poparte przywilejem, zasadą poufności lub postanowieniem sądu? Sądy nie pytają, czy strona produkująca oznaczyła jak najwięcej.

Oznaczenie bez właściwej podstawy jest naruszeniem postępowania odkrywczego. Nie ma znaczenia, czy zrobił to człowiek, czy AI. Dochodzenie przebiega oznaczenie po oznaczeniu.

Dla adwokatów oznacza to, że narzędzia przeglądu AI muszą być testowane pod kątem precyzji – udziału flag, które są naprawdę uprzywilejowane. Nie tylko recall. Narzędzie osiągające 90% recall przy 22,7% precyzji wyłapuje więcej wrażliwych treści. Ale tworzy obciążenie przeglądem dla 77,3% fałszywych flag. Kiedy ten przegląd nie następuje, wynika z niego szerokie nadmierne zatrzymywanie.

Każde oznaczenie w produkcji to twierdzenie do sądu. Mówi: ta treść jest zasadnie zatrzymana. Po sprawie Schnitzer Steel to twierdzenie musi się utrzymać.

Więcej informacji o tym, jak narzędzia anonimizacji różnią się od standardowej detekcji PII, znajdziesz w naszym przewodniku precyzja AI w przeglądzie dokumentów prawnych. Kontekst dotyczący dzienników przywilejów i narzędzi AI znajdziesz w naszym artykule tajemnica adwokacka a AI.

Źródła

Gotowy, aby chronić swoje dane?

Rozpocznij anonimizację PII z 285+ typami podmiotów w 48 językach.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.