Aktualizacja 2026
Dwa sposoby, w jakie redakcja zawodzi
Zespoły prawne stoją przed dwoma trybami awarii. Oba generują realne ryzyko odpowiedzialności.
Niedostateczna redakcja ujawnia uprzywilejowane dane lub dane osobowe, które muszą pozostać ukryte. Strona ujawnia materiał, do ochrony którego miała prawo – a często obowiązek.
Nadmierna redakcja ukrywa fakty, do których strona przeciwna ma prawo wglądu. Sądy traktują to jako utrudnianie postępowania. Jest to naruszenie postępowania odkrywczego podlegające sankcjom.
Narzędzia AI, które stawiają recall ponad precyzję, z założenia powodują drugi problem. Silnik AI, który zaciemnia 80% dokumentu, unika pominięcia czegokolwiek. Ale wynik jest bezużyteczny. Może też wywołać sankcje sądu.
Oba tryby awarii prowadzą do tego samego miejsca: sędzia, wyjaśnienia i koszty.
Sprawa Schnitzer Steel (2024)
Sprawa z 2024 roku Athletics Investment Group v. Schnitzer Steel pokazuje, jak sądy traktują niewłaściwe zatrzymywanie dokumentów.
Jedna ze stron przedstawiła dokumenty z szerokimi oznaczeniami. Pełnomocnik strony przeciwnej zakwestionował to. Sąd przejrzał materiały. Stwierdził, że oznaczenia wykraczały poza to, co prawo dopuszcza.
Efekt: sankcje na podstawie Federal Rule of Civil Procedure 37. Strona produkująca zapłaciła za wadliwy proces.
Takie sankcje nie są nowością. Sądy stosują je od lat. Wyróżniające jest tutaj znaczenie czasowe. Przegląd wspomagany przez AI jest teraz powszechny w postępowaniach sądowych. Sprawa nasuwa kluczowe pytanie: czy zespoły prawne sprawdziły precyzję swoich narzędzi AI przed ich wdrożeniem produkcyjnym?
Odpowiedź ma znaczenie. Narzędzie o niskiej precyzji oznaczy o wiele za dużo. Adwokat, który na nim polega bez weryfikacji, ponosi ryzyko.
Pełną analizę sprawy znajdziesz w analizie E-Discovery LLC dotyczącej zatrzymywania opartego na trafności.
Problem precyzji 22,7%
Presidio to silnik detekcji PII o otwartym kodzie źródłowym zbudowany przez Microsoft. Jest szeroko stosowany w narzędziach do przeglądu dokumentów. Testy na aktach sądowych i umowach dają mu precyzję 22,7%.
Precyzja mierzy, jak często pozytywna flaga jest prawidłowa. Przy 22,7%, około 77 na każde 100 flag to fałszywe alarmy. Te elementy nie są wrażliwe według żadnego obowiązującego standardu.
Dla e-discovery matematyka jest bezpośrednia. Zbiór 10 000 dokumentów przetworzonych przy tym wskaźniku będzie miał tysiące bezzasadnych oznaczeń. Strona produkująca staje w obliczu tego samego ryzyka co pozwana w sprawie Schnitzer Steel: zakwestionowana produkcja, przegląd sądowy i ewentualne sankcje.
Ta liczba dotyczy standardowej konfiguracji Presidio na treściach kancelarii prawnych. Nie wszystkie narzędzia AI działają na tym poziomie. Ale ten silnik jest najszerzej stosowaną opcją open-source w tej dziedzinie.
Przyczyna jest strukturalna. Systemy NLP trenują na ogólnym tekście. Język sądowy jest inny. Używa terminów specjalistycznych, formatów cytowań i zasad redakcji, które odbiegają od danych treningowych. Narzędzie działające dobrze na dokumentacji medycznej może radzić sobie znacznie gorzej na transkryptach przesłuchań.
Co dane o użyciu AI pokazują
Oto drugi punkt danych: 27,4% treści w chatbotach AI jest wrażliwe według niezależnej analizy użycia korporacyjnego AI.
To opisuje, co pracownicy wysyłają podczas normalnych zadań. Nie dane, które zamierzali udostępnić – treść zawarta przez nawyk lub przypadek. Prawnicy używający AI do tworzenia pism, przeglądania umów czy podsumowywania zeznań wysyłają wrażliwe treści na serwery AI jako efekt uboczny normalnej pracy.
Prawie trzy na dziesięć interakcji dotyczy danych klientów, informacji uprzywilejowanych lub strategii sprawy. Ta treść trafia na serwery dostawcy AI w użytecznej formie, chyba że kontrole ją wcześniej zatrzymają.
Dla kancelarii sprawdzających swoje ryzyko AI, 27,4% to nie problem marginalny. To bazowy wskaźnik. Prawie jedna trzecia użycia AI w kancelarii dotyczy treści wymagających ochrony.
Łańcuch odpowiedzialności
Nadmierne zatrzymywanie i wycieki danych AI tworzą oddzielne, ale powiązane ścieżki ryzyka. Obie zaczynają się od tej samej decyzji: wdrożenie narzędzia AI bez właściwej oceny.
Ścieżka discovery: AI szeroko oznacza treści → adwokat polega na wynikach bez wyrywkowej weryfikacji → produkcja ma nieuzasadnione oznaczenia → pełnomocnik strony przeciwnej kwestionuje → sąd przegląda → sankcje.
Ścieżka wycieku danych: Adwokat używa AI do pracy nad sprawą → AI otrzymuje uprzywilejowane komunikaty → dostawca AI doświadcza naruszenia → dane klienta zostają ujawnione → następują roszczenia z tytułu błędów w sztuce.
Punkt wyjścia jest taki sam w obu przypadkach. Kancelarie wdrażają narzędzia AI nie wiedząc, co te narzędzia faktycznie robią. Nie są ustanawiane żadne kontrole dla tej pracy.
Przegląd oparty na precyzji dla produkcji
Sądy zadają wąskie pytanie przy przeglądzie kwestionowanych oznaczeń. Czy każde z nich było poparte przywilejem, zasadą poufności lub postanowieniem sądu? Sądy nie pytają, czy strona produkująca oznaczyła jak najwięcej.
Oznaczenie bez właściwej podstawy jest naruszeniem postępowania odkrywczego. Nie ma znaczenia, czy zrobił to człowiek, czy AI. Dochodzenie przebiega oznaczenie po oznaczeniu.
Dla adwokatów oznacza to, że narzędzia przeglądu AI muszą być testowane pod kątem precyzji – udziału flag, które są naprawdę uprzywilejowane. Nie tylko recall. Narzędzie osiągające 90% recall przy 22,7% precyzji wyłapuje więcej wrażliwych treści. Ale tworzy obciążenie przeglądem dla 77,3% fałszywych flag. Kiedy ten przegląd nie następuje, wynika z niego szerokie nadmierne zatrzymywanie.
Każde oznaczenie w produkcji to twierdzenie do sądu. Mówi: ta treść jest zasadnie zatrzymana. Po sprawie Schnitzer Steel to twierdzenie musi się utrzymać.
Więcej informacji o tym, jak narzędzia anonimizacji różnią się od standardowej detekcji PII, znajdziesz w naszym przewodniku precyzja AI w przeglądzie dokumentów prawnych. Kontekst dotyczący dzienników przywilejów i narzędzi AI znajdziesz w naszym artykule tajemnica adwokacka a AI.