FOIA: KI reduziert Schwärzungszeiten von Wochen auf Stunden
Aktualisiert für 2026.
Die US-Bundesregierung gab 2024 schätzungsweise 500 Millionen Dollar für die FOIA-Bearbeitung aus. Der größte Teil dieser Kosten entfiel auf manuelle Schwärzung. Der Rückstand beim DOJ überschritt 100.000 offene Anfragen.
ARPA-H schrieb 2025 eine Beschaffung für KI-gestützte Schwärzungssoftware aus. HHS stellte fest, dass seine CMS-Abteilung KI-basierte Tools benötigte. Die manuelle Bearbeitung hatte Rückstände erzeugt, die das Personal nicht abbauen konnte.
Die Frage hat sich verschoben. Es geht nicht mehr darum, ob Behörden automatisieren sollten. Es geht darum, wie sie dies so umsetzen können, dass die Ergebnisse vor Gericht standhalten.
Das Problem mit dem Bundesrückstand
Nach 5 U.S.C. §552 müssen Behörden innerhalb von 20 Werktagen antworten. In der Praxis dauert es bei vielen Monaten. Manche brauchen Jahre.
Der DOJ-Rückstand von über 100.000 Anfragen entspricht ungefähr 2 Milliarden Minuten manueller Prüfung. Das setzt nur 20 Minuten pro Anfrage voraus. Bei staatlichen Stundensätzen gehen die Arbeitskosten in die Milliarden.
Der größte Teil dieser Zeit entfällt auf eine einzige Aufgabe. Mitarbeiter durchsuchen Seiten nach Namen, Adressen und Telefonnummern. Das erfordert keine juristische Beurteilung. Es erfordert Mustererkennung. Ein Algorithmus erledigt es in Sekunden.
Was ARPA-H und HHS benötigten
ARPA-H suchte KI-Schwärzungssoftware für die FOIA-Dokumentenverarbeitung. Die genannten Anforderungen umfassten fünf Bereiche:
- Automatische Erkennung personenbezogener Daten nach Ausnahme 6 und 7(C).
- Stapelverarbeitung großer Dokumentenmengen.
- Unterstützung gemischter Formate: PDF, Word und E-Mail.
- Dokumentation der Prüfpfade.
- Vertretbare Ausgabe für FOIA-Antworten.
HHS/CMS kam zum gleichen Ergebnis. Wachsende Volumina und gleichbleibende Personalstärke machten die manuelle Prüfung unhaltbar. Diese Behörden verfolgten keine neue Technologie um ihrer selbst willen. Sie lösten eine Compliance-Krise.
Landes- und Kommunalbehörden: Weniger Ressourcen
Bundesbehörden haben eigene FOIA-Büros und Rechtsbudgets. Landes- und Kommunalbehörden stehen denselben rechtlichen Pflichten mit weit weniger Ressourcen gegenüber.
Californias CPRA verlangt Antworten innerhalb von 10 Kalendertagen. Ein Landkreis mit einem dreiköpfigen Rechtsteam kann 2.000 Dokumente in diesem Zeitfenster nicht manuell bearbeiten. Die Optionen sind begrenzt:
- Ablehnen oder verzögern — was rechtliche Risiken schafft.
- Zeitarbeiter einstellen — teuer und langsam einzuarbeiten.
- Die mechanische Schwärzungsphase automatisieren.
Option 3 ist nun erreichbar. Die gleiche Stapelverarbeitung, die Bundesbehörden nutzen, steht kommunalen Rechtsabteilungen zur Verfügung. Keine langen Beschaffungszeiten erforderlich. Weitere Informationen bietet unsere Compliance-Übersicht zu den Vorschriften für öffentliche Aufzeichnungen in verschiedenen Rechtsbereichen.
EU-DSARs: Das gleiche Problem
DSGVO Artikel 15 Auskunftsersuchen (DSARs) schaffen eine parallele Herausforderung für EU-Organisationen. Anders als FOIA gelten DSAR-Pflichten für alle Organisationen, die personenbezogene Daten verarbeiten. Ein kleines SaaS-Unternehmen kann das gleiche DSAR-Volumen erhalten wie eine Großbank.
Die praktische Herausforderung spiegelt FOIA wider. Eine Organisation muss alle Daten vorlegen, die sie über eine bestimmte Person hält. Personenbezogene Daten Dritter müssen aus der Antwort geschwärzt werden. Die Frist beträgt 30 Tage.
Jedes DSAR, das E-Mail-Archive, Support-Tickets und Bestelldaten berührt, kann Hunderte von Dokumenten bedeuten. Für Organisationen, die 20–50 DSARs pro Monat bearbeiten, erfordert die manuelle Prüfung eine oder mehrere Vollzeitstellen. Die Stapelautomatisierung reduziert das auf Teilzeitarbeit.
Desktop-Verarbeitung für sensible Akten
Einige Behörden können keine webbasierten Tools nutzen. Daten, die im Behördensystem bleiben müssen, benötigen lokale Verarbeitung.
Die Desktop-App (anonym.plus) wurde genau dafür entwickelt:
- Die gesamte Verarbeitung läuft auf der eigenen Hardware der Behörde.
- Es werden keine Daten an externe Server übertragen.
- Stapelläufe verarbeiten 1–5.000 Dateien auf einmal.
- Unterstützte Formate: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
- Verarbeitete Dateien werden als ZIP-Archiv gepackt.
- CSV- und JSON-Export mit Metadaten pro Datei sind enthalten.
Für Behörden mit Air-Gap-Netzwerken oder strikten Datenspeichervorschriften ist die lokale Verarbeitung der einzige gangbare Weg. Die Desktop-App verwendet dasselbe Erkennungsmodell — XLM-RoBERTa mit 285+ Entitätstypen — wie die Webplattform. Vollständig offline.
Die Desktop-App-Dokumentation enthält Details zur Einrichtung.
Hinweise zur Implementierung
Prüfpfade. Behördliche Workflows erfordern Aufzeichnungen darüber, was geschwärzt wurde, auf welcher Grundlage und von wem. Stapelmetadaten decken die ersten beiden ab. Das Weiterleiten von Ausnahmedokumenten zur Mitarbeiterprüfung deckt den Rest ab.
Konsistenz. Eine FOIA-Antwort, die einen Namen in einem Dokument schwärzt, ihn aber in einem anderen übersieht, schafft rechtliche Risiken. Eine feste automatisierte Konfiguration beseitigt diese Inkonsistenz.
SBU-Materialien. Viele Behördendokumente sind sensibel, aber nicht klassifiziert. Die lokale Verarbeitung behandelt SBU-Dateien ohne Netzwerknutzung. Die webbasierte Verarbeitung mit geeigneten Datenverarbeitungsverträgen deckt Nicht-SBU-Dateien ab.
Ausgabeformat. Die Schwärzmethode verwendet schwarze Balkenersetzung. Dies entspricht dem Aussehen standardmäßiger FOIA-Schwärzungen und eignet sich für die Gerichtsproduktion. Der Token-Ansatz — etwa [GESCHWÄRZT - Ausnahme 6] — fügt explizite Ausnahme-Zitierung für detailliertere Dokumentation hinzu.
Fazit
FOIA ist eine gesetzliche Pflicht. Die 20-Werktage-Frist ist kein Ziel. Wenn Anfrageволumina das überschreiten, was das Personal manuell bewältigen kann, folgen systemische Fehler.
KI-gestützte Stapelschwärzung ersetzt keine juristische Beurteilung. Sie entfernt die mechanische Phase — das Auffinden und Markieren standardmäßiger personenbezogener Daten in Tausenden von Dokumenten. Diese Phase verbraucht 70–80% der Prüfzeit. Mitarbeiter können sich dann auf die 10–20% der Dokumente konzentrieren, bei denen Kontext und Urteilsvermögen wichtig sind.
ARPA-H und HHS/CMS haben das beide erkannt. Landes- und Kommunalbehörden sowie EU-Organisationen, die mit DSAR-Pflichten konfrontiert sind, stehen vor der gleichen Herausforderung. Unsere Sicherheits- und Compliance-Übersicht erläutert, wie vertretbare Schwärzungsworkflows strukturiert werden.