Zurück zum BlogTechnisch

FOIA im KI-Zeitalter: Wie Behörden die Redaktionszeit...

Die Bundesregierung gab 2024 schätzungsweise 500 Millionen Dollar für die FOIA-Bearbeitung aus, hauptsächlich für manuelle Redaktionen.

April 19, 20268 min Lesezeit
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA im KI-Zeitalter: Wie Behörden die Redaktionszeit von Wochen auf Stunden verkürzen

Die Bundesregierung gab 2024 schätzungsweise 500 Millionen Dollar für die FOIA-Bearbeitung aus. Der Großteil davon war manuelle Redaktion. Der FOIA-Rückstand des DOJ überstieg 100.000 Anfragen. Das HHS dokumentierte, dass seine CMS-Abteilung KI-gestützte Redaktionen erkundete, da die manuelle Bearbeitung unakzeptable Rückstände erzeugte. ARPA-H suchte 2025 ausdrücklich nach KI-Redaktionssoftware, um "künstliche Intelligenz zu nutzen, um Redaktionen durchzuführen und E-Discovery für die Due Diligence zu verwenden."

Die Erkenntnis, dass manuelle FOIA-Redaktionen nicht skalierbar sind, ist mittlerweile institutionalisiert. Die Frage hat sich von "sollten wir automatisieren?" zu "wie implementieren wir eine Automatisierung, die verteidigbare, vor Gericht zulässige Ergebnisse liefert?" verschoben.

Die Krise des föderalen FOIA-Rückstands

Nach 5 U.S.C. §552 müssen Bundesbehörden innerhalb von 20 Geschäftstagen auf FOIA-Anfragen reagieren. Behörden können "außergewöhnliche Umstände" anführen, um die Frist mit einer Mitteilung an den Antragsteller zu verlängern. In der Praxis arbeiten viele Behörden mit Reaktionszeiten, die in Monaten bis Jahren gemessen werden, nicht in Tagen.

Der Rückstand des DOJ von über 100.000 Anfragen entspricht etwa 2 Milliarden Minuten manueller Überprüfungszeit, wenn jede Anfrage nur 20 Minuten Überprüfung erfordert. Bei den staatlichen Abrechnungsraten sind das Milliarden von Dollar an Arbeitskosten — der Großteil davon für die mechanische Identifizierung und Redaktion von standardmäßigen PII.

Die Anfragen, die den Rückstand antreiben, sind keine komplexen rechtlichen Fragen, die juristisches Urteil erfordern. Es handelt sich um dokumentenlastige Anfragen, bei denen 80 % der Arbeit darin besteht, einen Textmarker über Tausende von Seiten zu ziehen, um Namen, Adressen und Telefonnummern zu finden — eine Arbeit, die ein Algorithmus in Sekunden ausführt.

Was ARPA-H und HHS erkannten

ARPA-H (Advanced Research Projects Agency for Health) gab eine Beschaffung bekannt, die speziell nach KI-Redaktionssoftware suchte, die für die Bearbeitung von FOIA-Dokumenten konzipiert ist. Die Anforderungen:

  • Automatische Identifizierung und Redaktion von FOIA-Ausnahmen 6 und 7(C) PII
  • Batch-Verarbeitung großer Dokumentensätze
  • Unterstützung gemischter Formate (PDF, Word, E-Mail-Formate)
  • Dokumentation der Prüfspur
  • Verteidigbare Ergebnisse, die für die FOIA-Antwort geeignet sind

HHS/CMS dokumentierte ähnliche Anforderungen in ihrer operativen Überprüfung und stellte fest, dass die Kombination aus wachsenden Anfragevolumina und statischen Personalressourcen die manuelle Bearbeitung mathematisch unhaltbar machte.

Diese Behörden verfolgen nicht aus Eigeninteresse modernste KI. Sie sind Behörden, die mit einer gesetzlichen Compliance-Krise konfrontiert sind und erkennen, dass die Lösung Automatisierung erfordert.

Bundes- und Landesregierung: Das unterversorgte Problem

Die FOIA-Herausforderung der Bundesregierung ist groß, aber gut ausgestattet — die Behörden haben spezielle FOIA-Büros, Budgets für rechtliche Überprüfungen und etablierte Arbeitsabläufe. Die Bundes- und Landesregierungen stehen vor denselben gesetzlichen Verpflichtungen mit einem Bruchteil der Ressourcen.

Kaliforniens CPRA (California Public Records Act) verlangt Antworten innerhalb von 10 Kalendertagen. Ein Landkreis mit einem 3-köpfigen Rechtsteam kann eine 2.000-Dokumente-Anfrage innerhalb dieses Zeitrahmens nicht durch manuelle Überprüfung bewältigen. Die Optionen sind:

  1. Ablehnen oder Verzögern (was rechtliche Risiken schafft)
  2. Temporäre juristische Mitarbeiter für große Anfragen einstellen (teuer, langsam einzuarbeiten)
  3. Die mechanische Redaktionsphase automatisieren

Option 3 ist jetzt machbar. Die gleiche Batch-Verarbeitungsfähigkeit, die Bundesbehörden zur Verfügung steht, ist auch für die Rechtsabteilungen der Landkreise ohne unternehmensweite Beschaffungsfristen zugänglich.

EU-Mitgliedstaat DSAR: Das gleiche Problem, andere Jurisdiktion

Die DSGVO Artikel 15 Anfragen von betroffenen Personen (DSARs) schaffen eine parallele Herausforderung für EU-Organisationen. Im Gegensatz zu FOIA (regierungs-spezifisch) gelten die DSAR-Verpflichtungen für alle Organisationen, die personenbezogene Daten verarbeiten. Ein SaaS-Unternehmen mit einem Jahresumsatz von 10 Millionen Euro kann das gleiche Volumen an DSARs erhalten wie ein großes Unternehmen, hat jedoch weniger Ressourcen zur Beantwortung.

Die praktische DSAR-Herausforderung spiegelt FOIA wider: Alle Daten, die über eine bestimmte Person gehalten werden, müssen innerhalb von 30 Tagen bereitgestellt werden, wobei PII von Dritten aus der Antwort redigiert werden muss. Jede DSAR, die E-Mail-Archive, Support-Tickets und Bestellunterlagen umfasst, kann die Überprüfung von Hunderten von Dokumenten zur Redigierung von Dritten erfordern.

Für Organisationen, die 20-50 DSARs pro Monat erhalten — ein Niveau, das einen oder mehrere FTE erfordert, die der DSAR-Antwort bei den aktuellen manuellen Bearbeitungsraten gewidmet sind — reduziert die Batch-Automatisierung dies auf Teilzeitarbeit.

Desktop-Anwendung: Offline-Regierungsverarbeitung

Regierungsbehörden, die mit klassifizierten oder sensiblen Unterlagen umgehen, stehen vor einer Einschränkung, die webbasierte Tools nicht adressieren können: Daten, die die Infrastruktur der Behörde nicht verlassen dürfen.

Die Desktop-App (anonym.plus) adressiert dies direkt:

  • Alle Verarbeitungen erfolgen lokal auf der Hardware der Behörde
  • Keine Daten werden an externe Server übertragen
  • Batch-Verarbeitung von 1-5.000 Dateien pro Durchlauf
  • Unterstützung gemischter Formate: PDF, DOCX, XLSX, TXT, CSV, JSON, XML
  • ZIP-Paketierung der verarbeiteten Dateien
  • CSV/JSON-Export mit Metadaten zur Dateiverarbeitung

Für Behörden mit luftdicht abgeschotteten Netzwerken oder strengen Anforderungen an den Datenstandort ist die lokale Verarbeitung nicht optional — sie ist der einzige gangbare Ansatz. Die Desktop-App bietet die gleiche Erkennungsgenauigkeit (XLM-RoBERTa, 285+ Entitätstypen) in einer Offline-Umgebung.

Implementierungsüberlegungen für Regierungszusammenhänge

Anforderungen an die Prüfspur: Die Redaktionsarbeitsabläufe der Regierung erfordern eine Dokumentation darüber, was redigiert wurde, auf welcher Grundlage, von wem und wann. Verarbeitungsmetadaten aus Batch-Operationen liefern die ersten beiden Elemente. Die Weiterleitung durch Überprüfungsabläufe (Ausnahmeüberprüfung durch das Personal der Behörde) liefert die letzten beiden.

Konsistenz über Dokumentensätze hinweg: FOIA-Antworten, die einen Namen in einigen Dokumenten, aber nicht in anderen redigieren, schaffen rechtliche Risiken. Automatisierte Verarbeitung mit konsistenter Konfiguration beseitigt Inkonsistenzen, die durch verschiedene Prüfer, die unterschiedliche Urteile anwenden, eingeführt werden.

Umgang mit sensiblen, aber nicht klassifizierten (SBU) Materialien: Viele Regierungsdokumente sind SBU und nicht klassifiziert. Die lokale Verarbeitung behandelt SBU-Materialien ohne Netzwerkübertragung. Webbasierte Verarbeitung auf EU-gehosteten Servern mit entsprechenden DPA-Vereinbarungen behandelt nicht-SBU-Materialien.

Vor Gericht zulässiges Redaktionsformat: Die Redact-Methode (Ersatz durch schwarze Balken) entspricht dem physischen Erscheinungsbild traditioneller FOIA-Redaktionen und ist für die vor Gericht zulässige Produktion geeignet. Der Ansatz mit Ersetzungstoken ([REDACTED - Ausnahme 6]) mit expliziter Ausnahmencitation bietet eine granularere Dokumentation.

Fazit

FOIA ist eine gesetzliche Anforderung. Die Frist von 20 Geschäftstagen für die Antwort ist nicht aspirational — die Nichteinhaltung schafft rechtliche Risiken und DPA-/Gerichtseingriffe. Wenn die Anfragevolumina die Kapazität der manuellen Verarbeitung überschreiten, folgen systematische Fehler.

KI-gestützte Batch-Redaktion ersetzt nicht das rechtliche Urteil der Behörde. Sie beseitigt die mechanische Phase — die Identifizierung und Entfernung standardmäßiger PII in Zehntausenden von Dokumenten — die 70-80 % der Überprüfungszeit in Anspruch nimmt. Das rechtliche Personal der Behörde konzentriert sich wieder auf die 10-20 % Ausnahme-Dokumente, bei denen der Kontext wichtig ist.

ARPA-H erkannte dies. HHS/CMS erkannte dies. Die Behörden mit den größten Rückständen bewegen sich in Richtung Automatisierung. Für Bundes- und Landesregierungen sowie EU-Organisationen, die DSAR-Verpflichtungen haben, gilt die gleiche Lösung.

Quellen:

Bereit, Ihre Daten zu schützen?

Beginnen Sie mit der Anonymisierung von PII mit über 285 Entitätstypen in 48 Sprachen.