FOIA: Pinaikli ng AI ang Redaction mula Linggo hanggang Oras
Ina-update para sa 2026.
Ang pederal na gobyerno ay naggastos ng tinatayang $500M sa pagproseso ng FOIA noong 2024. Ang karamihan sa gastos na iyon ay para sa manual na redaction. Ang backlog ng DOJ ay lumampas sa 100,000 bukas na kahilingan.
Nag-isyu ang ARPA-H ng procurement noong 2025 para sa AI redaction software. Natuklasan ng HHS na ang kanyang dibisyon ng CMS ay kailangan ng mga tool na pinapagana ng AI. Ang manu-manong trabaho ay lumikha ng mga backlog na hindi maalis ng mga kawani.
Nagbago na ang tanong. Hindi na ito tungkol sa kung dapat mag-automate. Ito ay tungkol sa kung paano gawin ito sa paraang matatambal sa korte.
Ang Problema ng Federal Backlog
Sa ilalim ng 5 U.S.C. §552, ang mga ahensiya ay dapat sumagot sa loob ng 20 araw ng negosyo. Sa katotohanan, marami ang tumatagal ng buwan. Ang ilan ay tumatagal ng mga taon.
Ang backlog ng DOJ na mahigit 100,000 kahilingan ay katumbas ng halos 2 bilyong minuto ng manu-manong pagsusuri. Iyon ay sa pagpapalagay na 20 minuto lamang bawat kahilingan. Sa mga rate ng singil ng gobyerno, ang gastos sa paggawa ay umaabot sa bilyon.
Ang karamihan sa oras na iyon ay napupunta sa isang gawain. Ina-scan ng mga kawani ang mga pahina para sa mga pangalan, address, at numero ng telepono. Hindi iyon kailangan ng paghuhusga ng abogado. Kailangan nito ng pattern matching. Ang isang algorithm ay ginagawa ito sa loob ng ilang segundo.
Ano ang Hiningi ng ARPA-H at HHS
Hinahanap ng ARPA-H ang AI redaction software para sa pagproseso ng dokumento ng FOIA. Ang kanilang mga nakasaad na kinakailangan ay:
- Auto-identification ng Exemption 6 at 7(C) personal na datos.
- Batch processing ng malalaking hanay ng dokumento.
- Suporta sa mixed format: PDF, Word, at email.
- Dokumentasyon ng audit trail.
- Defensible na output para sa tugon ng FOIA.
Nagkasundo rin ang HHS/CMS. Ang lumalaking dami at patag na staffing ay nagpagawa ng manual na pagsusuri na hindi napapanatili. Ang mga ahensyang ito ay hindi naghahanap ng bagong teknolohiya. Sila ay nagresolba ng krisis sa compliance.
Estado at Lokal: Mas Kaunting Mapagkukunan, Parehong Mga Patakaran
Ang mga pederal na ahensiya ay may mga dedikadong opisina ng FOIA at mga legal na badyet. Ang mga estado at lokal na pamahalaan ay nahaharap sa parehong mga legal na tungkulin na may mas kaunting mapagkukunan.
Ang CPRA ng California ay nangangailangan ng mga tugon sa loob ng 10 araw ng kalendaryo. Ang isang county na may tatlong tao na legal na team ay hindi kayang dumaan sa 2,000 dokumento sa loob ng window na iyon. Ang mga opsyon ay limitado:
- Tanggihan o ipagpaliban - na lumilikha ng legal na panganib.
- Mag-hire ng pansamantalang kawani - mahal at mabagal.
- I-automate ang mekanikal na yugto ng redaction.
Ang Opsyon 3 ay makakamit na ngayon. Ang parehong batch processing na ginagamit ng mga pederal na ahensiya ay available sa mga departamento ng legal ng county. Walang matagal na mga timeline ng procurement na kailangan. Tingnan ang aming compliance overview para sa kung paano naaangkop ang mga patakaran sa pampublikong rekord sa iba't ibang hurisdiksyon.
EU DSARs: Ang Parehong Problema
Ang GDPR Article 15 Data Subject Access Requests (DSARs) ay lumilikha ng parallel na hamon para sa mga organisasyon ng EU. Hindi tulad ng FOIA, ang mga obligasyon ng DSAR ay naaangkop sa lahat ng organisasyong humahawak ng personal na datos. Ang isang maliit na SaaS firm ay maaaring makatanggap ng parehong dami ng mga DSAR tulad ng isang malaking bangko.
Ang praktikal na hamon ay sumasalamin sa FOIA. Ang isang organisasyon ay dapat makagawa ng lahat ng datos na hawak tungkol sa isang partikular na tao. Ang personal na datos ng ikatlong partido ay dapat i-redact mula sa tugon. Ang deadline ay 30 araw.
Bawat DSAR na humahawak ng mga archive ng email, tiket ng suporta, at mga rekord ng order ay maaaring mangahulugang daan-daang dokumento ang kailangang suriin. Para sa mga organisasyon na humahawak ng 20-50 DSAR bawat buwan, ang manual na pagsusuri ay nangangailangan ng isa o higit pang full-time na kawani. Ang batch automation ay nagpapababa nito sa part-time na trabaho.
Desktop Processing para sa Sensitibong Rekord
Ilang ahensiya ay hindi maaring gumamit ng mga web-based na tool. Ang datos na dapat manatili sa loob ng mga sistema ng ahensiya ay nangangailangan ng lokal na pagproseso.
Ang Desktop App (anonym.plus) ay itinayo para sa ganitong kaso ng paggamit:
- Lahat ng pagproseso ay tumatakbo sa sariling hardware ng ahensiya.
- Walang datos na ipinapadala sa mga panlabas na server.
- Ang mga batch run ay humahawak ng 1-5,000 file sa isang pagkakataon.
- Mga sinusuportahang format: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
- Ang mga naprosesong file ay nakabalot bilang ZIP archive.
- Kasama ang CSV at JSON export na may per-file metadata.
Para sa mga ahensiya na may mga air-gapped network o mahigpit na mga patakaran sa residency ng datos, ang lokal na pagproseso ay ang tanging viable na landas. Ginagamit ng Desktop App ang parehong modelo ng detection - XLM-RoBERTa na may 285+ uri ng entity - bilang web platform. Gumagana ito nang ganap offline.
Tingnan ang aming Desktop App documentation para sa mga detalye ng setup.
Mga Tala sa Pagpapatupad
Mga audit trail. Ang mga workflow ng gobyerno ay nangangailangan ng mga rekord ng kung ano ang na-redact, sa anong batayan, at ng sino. Ang metadata ng batch ay sumasaklaw sa unang dalawa. Ang pag-ruta ng mga dokumento ng eksepsyon sa pamamagitan ng pagsusuri ng kawani ay sumasaklaw sa natitira.
Konsistensiya. Ang isang tugon ng FOIA na nag-i-redact ng pangalan sa isang dokumento ngunit nagpapalampas nito sa isa pa ay lumilikha ng legal na pagkakalantad. Ang isang fiksadong automated na configuration ay nag-aalis ng hindi konsistensiya na iyon.
Mga materyales na SBU. Maraming dokumento ng gobyerno ang sensitibo ngunit unclassified. Hinahawakan ng lokal na pagproseso ang mga SBU file nang walang paggamit ng network. Ang web-based na pagproseso na may wastong mga kasunduan ng DPA ay sumasaklaw sa mga hindi SBU na file.
Format ng output. Gumagamit ang paraan ng Redact ng pagpapalit ng itim na bar. Ito ay tumutugma sa hitsura ng mga karaniwang redaction ng FOIA at angkop para sa produksyon ng korte. Ang diskarte ng token - tulad ng [REDACTED - Exemption 6] - ay nagdadagdag ng eksplisitong citation ng exemption para sa mas detalyadong mga rekord.
Ang Konklusyon
Ang FOIA ay isang legal na tungkulin. Ang 20-araw-ng-negosyo na deadline ay hindi isang layunin. Kapag ang dami ng kahilingan ay higit sa kakayahan ng mga kawani, sumusunod ang mga kabiguan.
Ang AI-powered batch redaction ay hindi nagpapalit ng legal na paghuhusga. Inaalis nito ang mekanikal na yugto - paghanap at pagmamarka ng karaniwang personal na datos sa libu-libong dokumento. Ang yugtong iyon ay kumukonsumo ng 70-80% ng oras ng pagsusuri. Ang mga kawani ay maaari na ngayong mag-focus sa 10-20% ng mga dokumento kung saan mahalaga ang konteksto.
Nakita ito ng parehong ARPA-H at HHS/CMS. Ang mga estado at lokal na pamahalaan at mga organisasyon ng EU na nahaharap sa mga tungkulin ng DSAR ay nahaharap sa parehong hamon. Tingnan ang aming security and compliance overview para sa kung paano naka-istruktura ang mga defensible na workflow ng redaction.