title: "E-Discovery-Sanktionen: Wenn KI-Schwärzung zu weit geht" description: "Im Fall Athletics Investment Group v. Schnitzer Steel (2024) führten unzulässige Schwärzungen zu Discovery-Sanktionen. Mit einer KI-Präzision von nur 22,7 % tragen Anwaltsteams ein reales Haftungsrisiko." category: legal-tech publishedAt: 2026-03-12 tags:
- E-Discovery-Sanktionen
- Schwärzungshaftung
- KI-Schwärzungspräzision
- Dokumentenprüfung
- Legal Technology readingTime: 10
Aktualisiert für 2026
Zwei Wege, wie Schwärzung scheitert
Anwaltsteams stehen vor zwei Fehlertypen bei der Dokumentenschwärzung. Beide erzeugen echte Haftung.
Zu wenig Schwärzung legt privilegierte Daten oder persönliche Informationen offen, die verborgen bleiben müssen. Die produzierende Partei gibt Material preis, das sie ein Recht hatte — und oft die Pflicht — zu schützen.
Zu viel Schwärzung hält relevante Fakten zurück, die Gegner einsehen dürfen. Gerichte werten dies als Behinderung. Es ist ein sanktionsfähiger Discovery-Verstoß.
KI-Tools, die Recall gegenüber Präzision bevorzugen, erzeugen das zweite Problem durch ihr Design. Eine KI-Engine, die 80 % eines Dokuments schwärzt, um nichts zu verpassen, liefert nutzlose Ergebnisse. Sie kann auch Gerichtssanktionen nach sich ziehen.
Beide Fehlertypen enden am gleichen Ort: vor einem Richter, mit einer Erklärung und Kosten.
Der Fall Schnitzer Steel (2024)
Der Fall Athletics Investment Group v. Schnitzer Steel aus 2024 zeigt, wie Gerichte mit unzulässigem Zurückhalten von Dokumenten umgehen.
Eine Partei produzierte Dokumente mit umfangreichen Schwärzungen. Die gegnerische Partei erhob Einwände. Das Gericht untersuchte das Material. Es stellte fest, dass die Schwärzungen über das rechtlich zulässige Maß hinausgingen.
Das Ergebnis: Sanktionen nach Federal Rule of Civil Procedure 37. Die produzierende Partei trug die Kosten eines fehlerhaften Prüfprozesses.
Solche Sanktionen sind nicht neu. Gerichte setzen sie seit Jahren ein. Was diesen Fall auszeichnet, ist der Zeitpunkt. KI-gestützte Überprüfung ist in Rechtsstreitigkeiten nun üblich. Der Fall wirft eine wichtige Frage auf: Haben Anwaltsteams die Präzision ihrer KI-Tools geprüft, bevor sie diese in der Produktion einsetzen?
Die Antwort zählt. Ein Tool mit geringer Präzision markiert viel zu viel. Der Anwalt, der sich ohne Prüfung darauf verlässt, trägt das Risiko.
Eine detaillierte Fallanalyse bietet E-Discovery LLC zur Zulässigkeit von Relevanzschwärzungen.
Das 22,7-%-Präzisionsproblem
Presidio ist eine quelloffene PII-Erkennungs-Engine von Microsoft. Sie wird in vielen Dokumentenprüfungstools eingesetzt. Tests mit Gerichtsakten und Verträgen ergeben eine Präzisionsrate von 22,7 %.
Präzision misst, wie oft ein positiver Treffer korrekt ist. Bei 22,7 % sind etwa 77 von 100 markierten Elementen Falschmeldungen. Sie sind nach keinem anwendbaren Standard sensibel.
Für E-Discovery ist die Rechnung direkt. Ein Satz von 10.000 Dokumenten mit diesem Tool enthält Tausende unbegründete Markierungen. Die produzierende Partei trägt das gleiche Risiko wie der Beklagte in Schnitzer Steel: eine angefochtene Produktion, eine gerichtliche Prüfung und mögliche Sanktionen.
Dieser Wert gilt für Presidios Standard-Setup mit Kanzlei-Inhalten. Nicht alle KI-Tools arbeiten auf diesem Niveau. Aber diese Engine ist die meistgenutzte Open-Source-Option in der Branche.
Die Ursache ist strukturell. NLP-Systeme werden auf allgemeinen Texten trainiert. Gerichtssprache ist anders. Sie nutzt Fachbegriffe, Zitatformate und Formulierungsregeln, die von den Trainingsdaten abweichen. Ein Tool, das bei Krankenakten gut arbeitet, kann bei Vernehmungsprotokollen deutlich schlechter abschneiden.
Was Nutzungsdaten zeigen
Hier ein weiterer Datenpunkt: 27,4 % der KI-Chatbot-Inhalte sind sensibel, laut unabhängiger Analyse des Unternehmens-KI-Einsatzes.
Das beschreibt, was Mitarbeitende bei normalen Aufgaben einreichen. Nicht bewusst geteilte Daten — sondern aus Gewohnheit oder Versehen enthaltene Inhalte. Anwälte, die KI zum Verfassen von Briefen, zur Vertragsanalyse oder zur Zusammenfassung von Vernehmungen nutzen, senden als Nebeneffekt ihrer Arbeit sensible Inhalte an KI-Server.
Drei von zehn Interaktionen betreffen Mandantendaten, privilegierte Kommunikation oder Fallstrategien. Diese Inhalte erreichen die Server des KI-Anbieters in verwendbarer Form, sofern keine technischen Kontrollen eingreifen.
Für Kanzleien, die ihr KI-Risiko prüfen, ist 27,4 % kein Randproblem. Es ist die Basisannahme. Fast ein Drittel des KI-Einsatzes in einer Kanzlei betrifft schutzbedürftige Inhalte.
Die Haftungskette
Zu starkes Zurückhalten und KI-Datenlecks schaffen getrennte, aber verbundene Risikopfade. Beide beginnen mit derselben Entscheidung: KI-Tools ohne angemessene Prüfung einsetzen.
Der Discovery-Pfad: KI markiert Inhalte umfassend → Anwalt verlässt sich auf Ergebnis, ohne jede Markierung zu prüfen → Produktion enthält unbegründete Schwärzungen → Gegner erhebt Einwand → Gericht prüft → Sanktionen.
Der Datenleck-Pfad: Anwalt nutzt KI für Fallarbeit → KI erhält privilegierte Kommunikation → KI-Anbieter erleidet einen Datenschutzvorfall → Mandantendaten werden exponiert → Haftungsansprüche folgen.
Der Ausgangspunkt ist in beiden Fällen gleich. Kanzleien setzen KI-Tools ein, ohne zu wissen, was diese Tools wirklich tun. Geeignete Kontrollen fehlen.
Präzisionsorientierte Prüfung für Produktionen
Gerichte stellen eine enge Frage bei der Überprüfung angefochtener Markierungen. War jede durch Privileg, eine Vertraulichkeitsregel oder eine Gerichtsanordnung gedeckt? Gerichte fragen nicht, ob das Tool des Produzenten so viel wie möglich markiert hat.
Eine Markierung ohne sachliche Grundlage ist ein Discovery-Verstoß. Es spielt keine Rolle, ob Mensch oder KI sie erstellt hat. Die Prüfung erfolgt markierung für markierung.
Für Anwälte bedeutet das: KI-Prüftools müssen an der Präzision gemessen werden — dem Anteil der Markierungen, die tatsächlich privilegiert sind. Nicht nur am Recall. Ein Tool mit 90 % Recall bei 22,7 % Präzision erfasst mehr sensible Inhalte. Aber es schafft eine manuelle Prüflast für 77,3 % Fehlalarme. Wenn diese Prüfung ausbleibt, folgt systematisches Überschwärzen.
Jede Markierung in einer Produktion ist ein impliziter Anspruch an das Gericht. Sie sagt: Dieser Inhalt ist zu Recht zurückgehalten. Nach Schnitzer Steel muss dieser Anspruch standhalten.
Mehr dazu, wie Anonymisierungstools sich von Standard-PII-Erkennung unterscheiden, in unserem Leitfaden zur KI-Präzision bei der Dokumentenprüfung. Zum Thema Privileg-Logs und KI-Tools lesen Sie unseren Artikel zu Anwalt-Mandant-Privileg und KI.