FOIA: ИИ сокращает время редактирования с недель до часов
Обновлено для 2026 года.
В 2024 году федеральное правительство потратило на обработку запросов по FOIA около $500 млн. Большая часть этих расходов пришлась на ручное редактирование. Накопленный DOJ объём незакрытых запросов превысил 100 000.
ARPA-H в 2025 году объявил тендер на программное обеспечение для редактирования документов с помощью ИИ. HHS пришёл к выводу, что его подразделению CMS необходимы инструменты на основе ИИ. Ручная работа породила накопленный объём заявок, с которым сотрудники не справлялись.
Вопрос сместился. Речь идёт уже не о том, автоматизировать ли этот процесс, а о том, как сделать это так, чтобы результат устоял в суде.
Проблема накопленного объёма на федеральном уровне
По 5 U.S.C. §552 ведомства обязаны отвечать в течение 20 рабочих дней. На практике многие тратят месяцы. Некоторые — годы.
Накопленный объём DOJ из более чем 100 000 запросов равнозначен примерно 2 миллиардам минут ручного рассмотрения — при условии, что на каждый запрос тратится всего 20 минут. По государственным расценкам на персонал затраты составляют миллиарды долларов.
Большая часть этого времени уходит на одну задачу. Сотрудники просматривают страницы в поиске имён, адресов и номеров телефонов. Это не требует юридической квалификации. Это требует сопоставления с образцом. Алгоритм выполняет такую задачу за секунды.
Что требовали ARPA-H и HHS
ARPA-H искал программное обеспечение для редактирования документов FOIA на основе ИИ. Заявленные требования включали:
- Автоматическое выявление персональных данных по исключениям 6 и 7(C).
- Пакетную обработку больших наборов документов.
- Поддержку смешанных форматов: PDF, Word и электронная почта.
- Документацию журнала аудита.
- Защищаемый в суде результат для ответа по FOIA.
HHS/CMS пришёл к тем же выводам. Растущие объёмы при неизменной численности персонала сделали ручное рассмотрение невозможным. Эти ведомства не гонялись за новыми технологиями. Они решали кризис соответствия.
Штаты и муниципалитеты: меньше ресурсов, те же правила
Федеральные ведомства располагают выделенными службами FOIA и юридическими бюджетами. Органы власти штатов и муниципалитеты несут те же правовые обязательства при значительно меньших ресурсах.
CPRA Калифорнии требует ответа в течение 10 календарных дней. Юридическая служба округа из трёх человек не в состоянии обработать 2 000 документов за такой срок. Варианты ограничены:
- Отказать или задержать ответ — что создаёт правовой риск.
- Нанять временный персонал — дорого и долго.
- Автоматизировать механический этап редактирования.
Вариант 3 теперь доступен. Та же пакетная обработка, которую используют федеральные ведомства, доступна юридическим службам округов. Длительных процедур закупок не требуется. Подробнее о том, как нормы о публичных документах применяются в разных юрисдикциях, см. в нашем обзоре соответствия.
Запросы DSAR в ЕС: та же проблема
Запросы субъектов данных (DSAR) по статье 15 GDPR создают аналогичную проблему для европейских организаций. В отличие от FOIA, обязательства по DSAR распространяются на все организации, обрабатывающие персональные данные. Небольшая SaaS-компания может получать столько же DSAR, сколько крупный банк.
Практическая проблема схожа с FOIA. Организация должна предоставить все данные, которые она хранит о конкретном лице. Персональные данные третьих лиц необходимо вычеркнуть из ответа. Срок — 30 дней.
Каждый DSAR, затрагивающий архивы электронной почты, обращения в поддержку и записи о заказах, может означать сотни документов для проверки. Для организаций, получающих 20–50 DSAR в месяц, ручная проверка требует одного или нескольких штатных сотрудников, занятых полный рабочий день. Пакетная автоматизация сокращает нагрузку до неполного рабочего дня.
Локальная обработка для конфиденциальных документов
Некоторые ведомства не могут использовать веб-инструменты. Данные, которые должны оставаться в системах ведомства, требуют локальной обработки.
Для этого сценария предназначено настольное приложение (anonym.plus):
- Вся обработка выполняется на оборудовании ведомства.
- Данные не передаются на внешние серверы.
- Пакетная обработка выполняется для 1–5 000 файлов за раз.
- Поддерживаемые форматы: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
- Обработанные файлы упаковываются в ZIP-архив.
- Экспорт в CSV и JSON с метаданными по каждому файлу включён.
Для ведомств с изолированными сетями или строгими требованиями к резидентству данных локальная обработка — единственный жизнеспособный вариант. Настольное приложение использует ту же модель обнаружения — XLM-RoBERTa с 285+ типами сущностей, — что и веб-платформа. Оно работает полностью в автономном режиме.
См. документацию по настольному приложению для получения подробностей об установке.
Практические аспекты внедрения
Журналы аудита. Государственные рабочие процессы требуют записей о том, что было отредактировано, на каком основании и кем. Метаданные пакетной обработки охватывают первые два пункта. Маршрутизация исключительных документов через сотрудников закрывает остальное.
Согласованность. Ответ по FOIA, в котором имя вычеркнуто в одном документе, но пропущено в другом, создаёт правовую уязвимость. Фиксированная автоматизированная конфигурация устраняет такую несогласованность.
Материалы категории SBU. Многие государственные документы являются чувствительными, но не засекреченными. Локальная обработка справляется с файлами SBU без использования сети. Веб-обработка с надлежащими соглашениями об обработке данных охватывает файлы, не относящиеся к SBU.
Формат вывода. Метод Redact использует замену чёрными полосами. Это соответствует виду стандартного редактирования по FOIA и подходит для судебного производства. Токеновый подход — например, `[REDACTED - Exemption 6]` — добавляет явную ссылку на исключение для более детальных документов.
Главный вывод
FOIA — это правовая обязанность. Срок в 20 рабочих дней — не ориентир. Когда объём запросов превышает возможности персонала, неизбежны нарушения.
Пакетное редактирование на основе ИИ не заменяет юридической квалификации. Оно устраняет механический этап — поиск и маркировку стандартных персональных данных в тысячах документов. На этот этап уходит 70–80% времени проверки. Сотрудники могут сосредоточиться на 10–20% документов, где важен контекст.
ARPA-H и HHS/CMS оба пришли к этому выводу. Органы власти штатов и муниципалитеты, а также европейские организации, сталкивающиеся с обязательствами по DSAR, стоят перед той же проблемой. Подробнее о том, как структурируются защищаемые рабочие процессы редактирования, см. в обзоре безопасности и соответствия.