FOIA: AI ја намалува редакцијата од недели до часови
Ажурирано за 2026 година.
Федералната влада потрошила проценети $500M на обработка на FOIA во 2024 година. Поголемиот дел од тој трошок беше рачна редакција. Заостатокот на DOJ надмина 100.000 отворени барања.
ARPA-H издаде набавка во 2025 година за AI софтвер за редакција. HHS утврди дека неговата дивизија CMS треба алатки со AI поддршка. Рачната работа создаде заостатоци кои вработените не можеа да ги исчистат.
Прашањето се промени. Повеќе не е дали да се автоматизира. Тоа е за тоа како да се направи на начин кој е одржлив на суд.
Проблемот со федералниот заостаток
Според 5 U.S.C. §552, агенциите мора да одговорат во рок од 20 работни дена. Во пракса, многу одговараат во текот на месеци. Некои во текот на години.
Заостатокот на DOJ од 100.000+ барања е еднаков на приближно 2 милијарди минути рачен преглед. Тоа претпоставува само 20 минути по барање. По владините стапки на наплата, трошокот за труд достигнува милијарди.
Поголемиот дел од тоа време оди на една задача. Вработените ги прегледуваат страниците за имиња, адреси и телефонски броеви. Тоа не бара адвокатско расудување. Бара препознавање на шаблони. Алгоритам тоа го прави за секунди.
Што бараа ARPA-H и HHS
ARPA-H барал AI софтвер за редакција за обработка на документи за FOIA. Нивните наведени барања беа:
- Автоматско идентификување на лични податоци според Исклучок 6 и 7(C).
- Обработка во пакет на големи збирки документи.
- Поддршка за мешан формат: PDF, Word и е-пошта.
- Документација за ревизорска трага.
- Одбранлив резултат за одговор на FOIA.
HHS/CMS дојде до истиот заклучок. Растечките количини и рамен кадар ја направи рачниот преглед неодржлив. Овие агенции не јурат нова технологија. Тие решаваат криза на усогласеност.
Државни и локални власти: помалку ресурси, исти правила
Федералните агенции имаат посветени канцеларии за FOIA и правни буџети. Државните и локалните влади се соочуваат со исти правни обврски со многу помалку ресурси.
CPRA на Калифорнија бара одговори во рок од 10 календарски дена. Округ со правен тим од три лица не може да обработи 2.000 документи во тој временски прозорец. Опциите се ограничени:
- Одбивање или одложување - создава правен ризик.
- Вработување привремен персонал - скапо и бавно.
- Автоматизирање на механичката фаза на редакција.
Опцијата 3 е сега достапна. Истата обработка во пакет која ја користат федералните агенции е достапна за правните служби на округот. Не се потребни долги временски рокови за набавка. Погледнете го нашиот преглед на усогласеноста за тоа како правилата за јавни записи се применуваат низ јурисдикции.
ЕУ DSAR: Истиот проблем
Барањата за пристап на субјектот на GDPR според член 15 (DSAR) создаваат паралелен предизвик за организациите во ЕУ. За разлика од FOIA, DSAR обврските се однесуваат на сите организации кои ракуваат со лични податоци. Мала SaaS фирма може да прими ист обем на DSAR колку и голема банка.
Практичниот предизвик го одразува FOIA. Организацијата мора да ги произведе сите податоци кои ги чува за конкретно лице. Личните податоци на трети страни мора да бидат редактирани од одговорот. Рокот е 30 дена.
Секој DSAR кој допира архиви на е-пошта, билети за поддршка и записи за нарачки може да значи стотици документи за проверка. За организации кои обработуваат 20-50 DSAR месечно, рачниот преглед бара еден или повеќе вработени со полно работно време. Автоматизацијата во пакет го намалува тоа на работа со скратено работно време.
Десктоп обработка за чувствителни записи
Некои агенции не можат да користат веб-базирани алатки. Податоците кои мора да останат во системите на агенцијата бараат локална обработка.
Десктоп апликацијата (anonym.plus) е изградена за овој случај на употреба:
- Сета обработка се изврши на сопствениот хардвер на агенцијата.
- Никакви податоци не се испраќаат до надворешни сервери.
- Серијската обработка обработува 1-5.000 датотеки одеднаш.
- Поддржани формати: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
- Обработените датотеки се пакувани во ZIP архива.
- Вклучен е CSV и JSON извоз со метаподатоци по датотека.
За агенции со воздушно изолирани мрежи или строги правила за резиденција на податоци, локалната обработка е единствениот одржлив пат. Десктоп апликацијата го користи истиот модел за откривање - XLM-RoBERTa со 285+ типови на ентитети - како веб-платформата. Работи целосно офлајн.
Погледнете ја нашата документација за десктоп апликацијата за детали за поставување.
Белешки за имплементација
Ревизорски траги. Владините работни текови бараат записи за тоа што е редактирано, на каква основа и од кого. Метаподатоците за пакет ги покриваат првите два. Рутирањето на исклучителни документи преку преглед на персоналот го покрива остатокот.
Конзистентност. Одговор на FOIA кој редактира ime во еден документ, но го пропушта во друг создава правна изложеност. Фиксирана автоматизирана конфигурација ја отстранува таа недоследност.
SBU материјали. Многу владини документи се чувствителни, но некласифицирани. Локалната обработка ги обработува SBU датотеките без употреба на мрежа. Веб-базираната обработка со соодветни DPA договори ги покрива не-SBU датотеките.
Формат на излез. Методот Redact користи замена со црна лента. Ова го одговара изгледот на стандардните редакции на FOIA и е погодно за производство во суд. Токен пристапот - на пример [REDACTED - Exemption 6] - додава изречна цитација за исклучок за подетални записи.
Заклучок
FOIA е правна обврска. Рокот од 20 работни дена не е цел. Кога обемот на барања ги надминува можностите на вработените, следуваат неуспеси.
АI-напредната редакција во пакет не го заменува правното расудување. Ја отстранува механичката фаза - наоѓање и означување на стандардни лични податоци низ илјадници документи. Таа фаза троши 70-80% од времето за преглед. Вработените потоа можат да се фокусираат на 10-20% од документите каде контекстот е важен.
ARPA-H и HHS/CMS двете го виделе ова. Државните и локалните власти и организациите во ЕУ кои се соочуваат со DSAR обврски се соочуваат со истиот предизвик. Погледнете го нашиот преглед на безбедноста и усогласеноста за тоа како се структурирани работните текови за одбранлива редакција.