Tilbake til BloggTeknisk

FOIA i AI-æraen: Hvordan byråer reduserer...

Den føderale regjeringen brukte anslagsvis 500 millioner dollar på FOIA-behandling i 2024, mesteparten manuell redigering.

April 19, 20268 min lesing
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA i AI-æraen: Hvordan byråer reduserer redigeringstiden fra uker til timer

Den føderale regjeringen brukte anslagsvis 500 millioner dollar på FOIA-behandling i 2024. Mesteparten var manuell redigering. DOJ FOIA-backloggen oversteg 100 000 forespørsel. HHS dokumenterte at deres CMS-divisjon utforsket AI-drevet redigering fordi manuell behandling skapte uakseptable backlogger. ARPA-H søkte eksplisitt AI-redigeringsprogramvare i 2025 for å "utnytte kunstig intelligens til å utføre redigeringer og bruke e-discovery for due diligence."

Erkjennelsen av at manuell FOIA-redigering ikke kan skaleres er nå institusjonell. Spørsmålet har skiftet fra "bør vi automatisere?" til "hvordan implementerer vi automatisering som gir forsvarlig, retts-admissibel output?"

Den føderale FOIA-backlogkrisen

I henhold til 5 U.S.C. §552 må føderale byråer svare på FOIA-forespørsel innen 20 virkedager. Byråer kan påberope seg "uvanlige omstendigheter" for å forlenge fristen med varsel til forespørselen. I praksis opererer mange byråer med responstider målt i måneder til år, ikke dager.

DOJ-backloggen på over 100 000 forespørsel representerer omtrent 2 milliarder minutter med manuell gjennomgangstid hvis hver forespørsel involverer bare 20 minutter med gjennomgang. Til regjeringens faktureringssatser er det milliarder av dollar i arbeidskraft — mesteparten for mekanisk identifikasjon og redigering av standard PII.

Forespørslene som driver backloggen er ikke komplekse juridiske spørsmål som krever advokatvurdering. De er dokumenttunge forespørsel der 80 % av arbeidet er å bruke en høylytter over tusenvis av sider for å se etter navn, adresser og telefonnumre — arbeid som en algoritme utfører på sekunder.

Hva ARPA-H og HHS erkjente

ARPA-H (Advanced Research Projects Agency for Health) utstedte en anskaffelse som søkte AI-redigeringsprogramvare spesifikt designet for å håndtere FOIA-dokumentbehandling. Kravene:

  • Automatisk identifikasjon og redigering av FOIA Unntak 6 og 7(C) PII
  • Batchbehandling av store dokumentsett
  • Støtte for blandede formater (PDF, Word, e-postformater)
  • Revisjonsspor dokumentasjon
  • Forsvarlig output passende for FOIA-svar

HHS/CMS dokumenterte lignende krav i sin operasjonelle gjennomgang, og bemerket at kombinasjonen av økende forespørselvolumer og statisk bemanning gjorde manuell behandling matematisk usustainable.

Dette er ikke byråer som forfølger banebrytende AI for sin egen skyld. De er byråer som står overfor en lovpålagt samsvars-krise og erkjenner at løsningen krever automatisering.

Statlige og lokale myndigheter: Problemet med underbetjening

Den føderale regjeringens FOIA-utfordring er stor, men ressurssterk — byråer har dedikerte FOIA-kontorer, budsjett for juridisk gjennomgang, og etablerte arbeidsflyter. Statlige og lokale myndigheter står overfor de samme lovpålagte forpliktelsene med en brøkdel av ressursene.

Californias CPRA (California Public Records Act) krever svar innen 10 kalenderdager. Et fylke med et 3-personers juridisk team kan ikke håndtere en 2 000-dokument forespørsel innen det vinduet gjennom manuell gjennomgang. Valgene er:

  1. Avvise eller forsinke (skape juridisk eksponering)
  2. Ansette midlertidig juridisk personale for store forespørsel (dyrt, tregt å onboarde)
  3. Automatisere den mekaniske redigeringsfasen

Alternativ 3 er nå levedyktig. Den samme batchbehandlingskapasiteten tilgjengelig for føderale byråer er tilgjengelig for fylkesjuridiske avdelinger uten tidslinjer for anskaffelse av bedrifter.

EU-medlemsstat DSAR: Det samme problemet, annen jurisdiksjon

GDPR Artikkel 15 Data Subject Access Requests (DSARs) skaper en parallell utfordring for EU-organisasjoner. I motsetning til FOIA (regjeringsspesifikk), gjelder DSAR-forpliktelser for alle organisasjoner som behandler personopplysninger. Et SaaS-selskap med en årlig inntekt på 10 millioner euro kan motta det samme volumet av DSAR-er som en stor bedrift, med færre ressurser til å svare.

Den praktiske DSAR-utfordringen speiler FOIA: produsere alle data som holdes om en spesifikk person, med tredjeparts PII redigert fra svaret, innen 30 dager. Hver DSAR som involverer e-postarkiv, supportbilletter og bestillingsopptegnelser kan kreve gjennomgang av hundrevis av dokumenter for tredjepartsredigering.

For organisasjoner som mottar 20-50 DSAR-er per måned — et nivå som krever en eller flere FTE dedikert til DSAR-svar til nåværende manuelle behandlingssatser — reduserer batchautomatisering dette til deltidsarbeid.

Desktop-applikasjon: Offline regjeringbehandling

Regjeringsbyråer som håndterer klassifiserte eller sensitive opptegnelser står overfor en begrensning som nettbaserte verktøy ikke kan adressere: data som ikke kan forlate byråets infrastruktur.

Desktop-appen (anonym.plus) adresserer dette direkte:

  • All behandling skjer lokalt på byråets maskinvare
  • Ingen data overføres til eksterne servere
  • Batchbehandling av 1-5 000 filer per kjøring
  • Støtte for blandede formater: PDF, DOCX, XLSX, TXT, CSV, JSON, XML
  • ZIP-pakking av behandlede filer
  • CSV/JSON-eksport med prosesseringsmetadata per fil

For byråer med luftgapede nettverk eller strenge datalagringskrav er lokal behandling ikke valgfritt — det er den eneste levedyktige tilnærmingen. Desktop-appen gir samme deteksjonsnøyaktighet (XLM-RoBERTa, 285+ enhetstyper) i et offline miljø.

Implementeringsvurderinger for regjeringskontekster

Revisjonsspor krav: Regjeringens redigeringsarbeidsflyter krever dokumentasjon av hva som ble redigert, på hvilket grunnlag, av hvem, og når. Prosesseringsmetadata fra batchoperasjoner gir de to første elementene. Ruting gjennom gjennomgangsarbeidsflyter (unntaksgjennomgang av byråpersonell) gir de to siste.

Konsistens på tvers av dokumentsett: FOIA-svar som redigerer et navn i noen dokumenter, men ikke andre, skaper juridisk eksponering. Automatisert behandling med konsekvent konfigurasjon eliminerer inkonsistens introdusert av forskjellige vurderere som anvender ulik vurdering.

Håndtering av sensitive, men ikke klassifiserte (SBU) dokumenter: Mange regjeringsdokumenter er SBU i stedet for klassifiserte. Lokal behandling håndterer SBU-materialer uten nettverksoverføring. Nettbasert behandling på EU-vertede servere med passende DPA-avtaler håndterer ikke-SBU-materialer.

Retts-admissibel redigeringsformat: Redact-metoden (svart strek erstatning) matcher den fysiske utseendet til tradisjonelle FOIA-redigeringer og er passende for retts-admissibel produksjon. Erstatningstoken-tilnærmingen ([REDACTED - Unntak 6]) med eksplisitt unntaksreferanse gir mer detaljert dokumentasjon.

Konklusjon

FOIA er et lovpålagt krav. Fristen på 20 virkedager for svar er ikke aspirerende — manglende overholdelse skaper juridisk eksponering og DPA/rettsintervensjon. Når forespørselvolumer overstiger kapasiteten til manuell behandling, følger systematiske feil.

AI-drevet batchredigering erstatter ikke byråets juridiske vurdering. Det eliminerer den mekaniske fasen — identifisering og fjerning av standard PII i titusenvis av dokumenter — som tar 70-80 % av gjennomgangstiden. Byråets juridiske personale fokuserer på de 10-20 % unntaksdokumentene der konteksten betyr noe.

ARPA-H erkjente dette. HHS/CMS erkjente dette. Byråene som står overfor de største backloggene beveger seg mot automatisering. For statlige og lokale myndigheter og EU-organisasjoner som står overfor DSAR-forpliktelser, gjelder den samme løsningen.

Kilder:

Klar til å beskytte dataene dine?

Begynn å anonymisere PII med 285+ enhetstyper på 48 språk.