anonym.legal
Назад към блогаТехнически

FOIA в ерата на AI: Как агенциите съкращават времето...

Федералното правителство е похарчило около 500 милиона долара за обработка на FOIA през 2024 г., предимно ръчна редакция.

April 19, 20268 мин. четене
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA в ерата на AI: Как агенциите съкращават времето за редактиране от седмици на часове

Федералното правителство е похарчило около 500 милиона долара за обработка на FOIA през 2024 г. Повечето от тях са ръчна редакция. Натрупването на DOJ FOIA надхвърли 100 000 искания. HHS документира, че неговият отдел за CMS е проучил редактиране, задвижвано от AI, тъй като ръчната обработка създава неприемливи натрупвания. ARPA-H изрично поиска софтуер за редактиране на AI през 2025 г., за да „използва изкуствения интелект за извършване на редакции и използване на електронно откриване за надлежна проверка“.

Признаването, че ръчното редактиране на FOIA не може да бъде мащабирано, вече е институционално. Въпросът се измести от "трябва ли да автоматизираме?" на "как да внедрим автоматизация, която произвежда защитими, допустими от съда резултати?"

Федералната FOIA криза с изостаналите дела

Под 5 U.S.C. §552, федералните агенции трябва да отговорят на искания FOIA в рамките на 20 работни дни. Агенциите могат да се позовават на „необичайни обстоятелства“, за да удължат крайния срок с предизвестие до заявителя. На практика много агенции работят с време за реакция, измерено в месеци до години, а не в дни.

Натрупването на DOJ от 100 000+ искания представлява приблизително 2 милиарда минути време за ръчен преглед, ако всяка заявка включва само 20 минути преглед. При тарифите на правителството за таксуване, това са милиарди долари труд – повечето от тях за механична идентификация и редактиране на стандартна PII.

Исканията, водещи до изоставането, не са сложни правни въпроси, изискващи преценка на адвокат. Това са заявки, натоварени с документи, при които 80% от работата се състои в пускане на маркер в хиляди страници, търсещ имена, адреси и телефонни номера – работа, която алгоритъмът извършва за секунди.

Какво признават ARPA-H и HHS

ARPA-H (Агенция за напреднали изследователски проекти за здравеопазване) издаде поръчка за търсене на софтуер за редактиране на AI, специално проектиран да обработва FOIA обработка на документи. Изискванията:

  • Автоматично идентифициране и редактиране на FOIA Изключение 6 и 7(C) PII
  • Пакетна обработка на големи комплекти документи
  • Поддръжка на смесен формат (PDF, Word, имейл формати)
  • Документация за одитна пътека
  • Защитен изход, подходящ за FOIA отговор

HHS/CMS документира подобни изисквания в техния оперативен преглед, отбелязвайки, че комбинацията от нарастващи обеми на заявки и статичен персонал прави ръчната обработка математически неустойчива.

Това не са агенции, преследващи авангарден AI заради самия него. Те са агенции, изправени пред криза на нормативното съответствие и признаващи, че решението изисква автоматизация.

Държавно и местно управление: Проблемът с недостатъчно обслужване

Предизвикателството FOIA на федералното правителство е голямо, но разполага с ресурси – агенциите разполагат със специални офиси FOIA, бюджет за правен преглед и установени работни процеси. Държавните и местните власти са изправени пред същите законови задължения с част от ресурсите.

Калифорнийският CPRA (Калифорнийски закон за публичните регистри) изисква отговори в рамките на 10 календарни дни. Окръг с правен екип от 3 души не може да приеме заявка за записи от 2000 документа в този прозорец чрез ръчен преглед. Изборите са:

  1. Отказ или забавяне (създаване на правна експозиция)
  2. Наемете временен правен персонал за големи заявки (скъпи, бавни за работа)
  3. Автоматизирайте фазата на механична редакция

Вариант 3 вече е приложим. Същата способност за групова обработка, достъпна за федералните агенции, е достъпна за правните отдели на окръга без времеви графики за обществени поръчки на предприятието.

Държава-членка на ЕС DSAR: Същият проблем, различна юрисдикция

GDPR Член 15 Заявките за достъп на субекти на данни (DSAR) създават паралелно предизвикателство за организациите в ЕС. За разлика от FOIA (специфично за правителството), задълженията по DSAR се прилагат за всички организации, обработващи лични данни. SaaS компания с годишен приход от 10 милиона евро може да получи същия обем DSAR като голямо предприятие, с по-малко ресурси за отговор.

Практическото предизвикателство DSAR отразява FOIA: създайте всички данни, съхранявани за конкретно лице, с PII на трета страна, редактиран от отговора, в рамките на 30 дни. Всеки DSAR, включващ имейл архиви, билети за поддръжка и записи за поръчки, може да изисква преглед на стотици документи за редактиране от трети страни.

За организации, получаващи 20-50 DSARs на месец — ниво, което изисква един или повече FTE, посветени на DSAR отговор при текущите скорости на ръчна обработка — партидната автоматизация намалява това до работа на непълно работно време.

Настолно приложение: Офлайн правителствена обработка

Правителствените агенции, обработващи класифицирани или чувствителни записи, са изправени пред ограничение, което уеб базираните инструменти не могат да адресират: данни, които не могат да напускат инфраструктурата на агенцията.

Приложението за настолен компютър (anonym.plus) адресира това директно:

  • Цялата обработка се извършва локално на хардуера на агенцията
  • Няма данни, предавани към външни сървъри
  • Пакетна обработка на 1-5000 файла на изпълнение
  • Поддръжка на смесен формат: PDF, DOCX, XLSX, TXT, CSV, JSON, XML
  • ZIP опаковка на обработените файлове
  • CSV/JSON експорт с метаданни за обработка на всеки файл

За агенции с безвъздушни мрежи или строги изисквания за пребиваване на данни, локалната обработка не е по избор — това е единственият жизнеспособен подход. Приложението за настолен компютър осигурява същата точност на откриване (XLM-RoBERTa, 285+ типа обекти) в офлайн среда.

Съображения за прилагане за правителствен контекст

Изисквания за одитна пътека: Правителствените работни потоци за редактиране изискват документация за това какво е редактирано, на каква основа, от кого и кога. Обработката на метаданни от пакетни операции осигурява първите два елемента. Маршрутизирането през работни потоци за преглед (с изключение на прегледа от персонала на агенцията) осигурява последните две.

Съгласуваност между комплектите документи: Отговорите FOIA, които редактират име в някои документи, но не и други, създават правна експозиция. Автоматизираната обработка с последователна конфигурация елиминира несъответствието, въведено от различни рецензенти, прилагащи различна преценка.

**Чувствителна, но некласифицирана (SBU) работа: ** Много държавни документи са SBU, а не класифицирани. Локалната обработка обработва SBU материали без мрежово предаване. Уеб базираната обработка на хоствани в ЕС сървъри с подходящи споразумения за DPA обработва материали, които не са SBU.

Допустим от съда редакционен формат: ** Методът Redact (замяна на черна лента) съответства на физическия вид на традиционните FOIA редакции и е подходящ за допустимо от съда производство. Подходът за заместващ токен ([REDACTED - Изключение 6]**) с изрично цитиране на освобождаване предоставя по-подробна документация.

Заключение

FOIA е законово изискване. Крайният срок за отговор от 20 работни дни не е амбициозен — неспазването му създава правна опасност и намеса на DPA/съд. Когато обемите на заявките надхвърлят капацитета на ръчната обработка, следват системни повреди.

Пакетното редактиране, задвижвано от AI, не замества правната преценка на агенцията. Той елиминира механичната фаза - идентифициране и премахване на стандартни PII в десетки хиляди документи - която отнема 70-80% от времето за преглед. Правният персонал на агенцията се фокусира отново върху документите с изключение от 10-20%, когато контекстът има значение.

ARPA-H разпозна това. HHS/CMS разпозна това. Агенциите, изправени пред най-големи натрупани дела, се насочват към автоматизация. За държавни и местни власти и организации от ЕС, изправени пред задължения по DSAR, важи същото решение.

Източници:

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.