FOIA: AI smanjuje redakciju s tjedana na sate
Azurirano za 2026.
Americka savezna vlada potrosila je procijenjenih 500 milijuna dolara na obradu FOIA zahtjeva u 2024. Vecina tog troska bila je rucna redakcija. Zaostaci DOJ-a presli su 100.000 otvorenih zahtjeva.
ARPA-H je 2025. pokrenuo nabavu softvera za AI redakciju. HHS je utvrdio da njegov CSD odjel treba alate s podrzanom AI. Rucni rad stvorio je zaostake koje osoblje nije moglo rjesiti.
Pitanje se promijenilo. Vise nije o tome treba li automatizirati. Radi se o tome kako to uciniti na nacin koji ce se odrzati na sudu.
Problem federalnih zaostaka
Prema 5 U.S.C. 552, agencije moraju odgovoriti u roku od 20 radnih dana. U praksi, mnoge traze mjesece. Neke traze godine.
Zaostatak DOJ-a od 100.000+ zahtjeva jednak je otprilike 2 milijarde minuta rucnog pregleda. To pretpostavlja samo 20 minuta po zahtjevu. Po drzavnim stopama naplacivanja, troskovi rada ulaze u milijarde.
Vecina tog vremena ide na jedan zadatak. Osoblje pregledava stranice u potrazi za imenima, adresama i brojevima telefona. To ne zahtijeva pravnu prosudbu odvjetnika. Zahtijeva podudaranje uzoraka. Algoritam to radi u sekundama.
Sto su trazili ARPA-H i HHS
ARPA-H je trazio softver za AI redakciju za obradu FOIA dokumenata. Navedeni zahtjevi bili su:
- Automatska identifikacija osobnih podataka prema Iznimkama 6 i 7(C).
- Grupna obrada velikih skupova dokumenata.
- Podrska za mijesane formate: PDF, Word i e-posta.
- Dokumentacija revizijskog traga.
- Obranjivi rezultat za FOIA odgovor.
HHS/CMS dosao je do istog zakljucka. Rastuci volumeni i nepromijenjeno osoblje ucinili su rucni pregled neodrzivim. Ove agencije nisu trazile novu tehnologiju. Rjesavale su krizu uskladjenosti.
Drzavne i lokalne vlasti: manje resursa, ista pravila
Savezne agencije imaju namjenske FOIA urede i pravne proracune. Drzavne i lokalne vlasti suocavaju se s istim pravnim obvezama s daleko manje resursa.
Kalifornijski CPRA zahtijeva odgovore u roku od 10 kalendarskih dana. Okrug s troclanim pravnim timom ne moze pregledati 2.000 dokumenata u tom vremenskom okviru. Mogucnosti su ogranicene:
- Odbiti ili odgoditi - sto stvara pravni rizik.
- Zaposliti privremeno osoblje - skupo i sporo.
- Automatizirati fazu mehanicke redakcije.
Mogucnost 3 sada je dostizna. Ista grupna obrada koju koriste savezne agencije dostupna je okruznim pravnim odjelima. Nisu potrebni dugi rokovi nabave. Pogledajte nas pregled uskladjenosti za to kako se pravila javnih evidencija primjenjuju u raznim jurisdikcijama.
EU DSAR-ovi: isti problem
Zahtjevi ispitanika za pristup podacima (DSAR) prema GDPR clanku 15 stvaraju paralelni izazov za EU organizacije. Za razliku od FOIA, DSAR obveze primjenjuju se na sve organizacije koje rukuju osobnim podacima. Mala SaaS tvrtka moze primiti isti volumen DSAR-ova kao velika banka.
Prakticki izazov odrazava FOIA. Organizacija mora proizvesti sve podatke koji se drzavaju o odredjenoj osobi. Osobni podaci trecih strana moraju biti redaktirani iz odgovora. Rok je 30 dana.
Svaki DSAR koji dira arhive e-poste, zahtjeve za podrsku i zapise narudzbi moze znaciti stotine dokumenata za provjeru. Za organizacije koje obradjuju 20-50 DSAR-ova mjesecno, rucni pregled zahtijeva jednog ili vise zaposlenika na puno radno vrijeme. Grupna automatizacija to svodi na posao s nepunim radnim vremenom.
Lokalna obrada za osjetljive zapise
Neke agencije ne mogu koristiti web-bazirane alate. Podaci koji moraju ostati unutar agencijskih sustava trebaju lokalnu obradu.
Desktop App (anonym.plus) je napravljen za ovaj slucaj koristenja:
- Sva obrada izvodi se na agencijskom vlastitom hardveru.
- Nikakvi podaci ne salju se vanjskim posluziteljima.
- Grupne operacije obradjuju 1 do 5.000 datoteka odjednom.
- Podrzani formati: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
- Obradjene datoteke pakiraju se kao ZIP arhiva.
- Ukljucen je CSV i JSON izvoz s metapodacima po datoteci.
Za agencije s izoliranim mrezama ili strogim pravilima o rezidenciji podataka, lokalna obrada je jedini izvedivi put. Desktop App koristi isti model detekcije - XLM-RoBERTa s 285+ vrsta entiteta - kao web platforma. Radi potpuno izvan mreze.
Pogledajte nasu dokumentaciju Desktop App-a za detalje postavljanja.
Napomene o implementaciji
Revizijski tragovi. Vladini tijekovi rada zahtijevaju evidenciju o tome sto je redaktirano, na kojoj osnovi i od koga. Grupni metapodaci pokrivaju prva dva. Usmjeravanje izuzetnih dokumenata kroz pregled osoblja pokriva ostatak.
Dosljednost. FOIA odgovor koji redaktira ime u jednom dokumentu, ali ga propusta u drugom, stvara pravnu izlozenost. Fiksna automatizirana konfiguracija uklanja tu nedosljednost.
SBU materijali. Mnogi vladini dokumenti su osjetljivi, ali neklasificirani. Lokalna obrada rukuje SBU datotekama bez koristenja mreze. Web-bazirana obrada s odgovarajucim DPA sporazumima pokriva ne-SBU datoteke.
Format izlaza. Metoda Redact koristi zamjenu crnom trakom. To odgovara izgledu standardnih FOIA redakcija i pogodno je za produkciju na sudu. Token pristup - kao sto je [REDACTED - Exemption 6] - dodaje eksplicitno citiranje iznimke za detaljnije zapise.
Kljucna poruka
FOIA je zakonska obveza. Rok od 20 radnih dana nije cilj. Kada volumeni zahtjeva premasuju ono sto osoblje moze obraditi, dolazi do propusta.
AI grupna redakcija ne zamjenjuje pravnu prosudbu. Uklanja mehanicku fazu - pronalazak i oznacavanje standardnih osobnih podataka u tisucama dokumenata. Ta faza trosila 70-80% vremena pregleda. Osoblje se zatim moze usredotociti na 10-20% dokumenata gdje kontekst ima znacaj.
ARPA-H i HHS/CMS su to prepoznali. Drzavne i lokalne vlasti i EU organizacije koje se suocavaju s DSAR obvezama suocavaju se s istim izazovom. Pogledajte nas pregled sigurnosti i uskladjenosti za to kako su strukturirani obranjivi tijekovi rada redakcije.