anonym.legal

By · Last updated 2026-05-28

Назад к блогуТехнические

FOIA: ИИ сокращает время редактирования с недель до часов

В 2024 году федеральное правительство потратило на обработку запросов по FOIA около $500 млн, преимущественно на ручное редактирование. ARPA-H специально искал ПО для редактирования на основе ИИ.

May 28, 20268 мин чтения
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: ИИ сокращает время редактирования с недель до часов

Обновлено для 2026 года.

В 2024 году федеральное правительство потратило на обработку запросов по FOIA около $500 млн. Большая часть этих расходов пришлась на ручное редактирование. Накопленный DOJ объём незакрытых запросов превысил 100 000.

ARPA-H в 2025 году объявил тендер на программное обеспечение для редактирования документов с помощью ИИ. HHS пришёл к выводу, что его подразделению CMS необходимы инструменты на основе ИИ. Ручная работа породила накопленный объём заявок, с которым сотрудники не справлялись.

Вопрос сместился. Речь идёт уже не о том, автоматизировать ли этот процесс, а о том, как сделать это так, чтобы результат устоял в суде.

Проблема накопленного объёма на федеральном уровне

По 5 U.S.C. §552 ведомства обязаны отвечать в течение 20 рабочих дней. На практике многие тратят месяцы. Некоторые — годы.

Накопленный объём DOJ из более чем 100 000 запросов равнозначен примерно 2 миллиардам минут ручного рассмотрения — при условии, что на каждый запрос тратится всего 20 минут. По государственным расценкам на персонал затраты составляют миллиарды долларов.

Большая часть этого времени уходит на одну задачу. Сотрудники просматривают страницы в поиске имён, адресов и номеров телефонов. Это не требует юридической квалификации. Это требует сопоставления с образцом. Алгоритм выполняет такую задачу за секунды.

Что требовали ARPA-H и HHS

ARPA-H искал программное обеспечение для редактирования документов FOIA на основе ИИ. Заявленные требования включали:

  • Автоматическое выявление персональных данных по исключениям 6 и 7(C).
  • Пакетную обработку больших наборов документов.
  • Поддержку смешанных форматов: PDF, Word и электронная почта.
  • Документацию журнала аудита.
  • Защищаемый в суде результат для ответа по FOIA.

HHS/CMS пришёл к тем же выводам. Растущие объёмы при неизменной численности персонала сделали ручное рассмотрение невозможным. Эти ведомства не гонялись за новыми технологиями. Они решали кризис соответствия.

Штаты и муниципалитеты: меньше ресурсов, те же правила

Федеральные ведомства располагают выделенными службами FOIA и юридическими бюджетами. Органы власти штатов и муниципалитеты несут те же правовые обязательства при значительно меньших ресурсах.

CPRA Калифорнии требует ответа в течение 10 календарных дней. Юридическая служба округа из трёх человек не в состоянии обработать 2 000 документов за такой срок. Варианты ограничены:

  1. Отказать или задержать ответ — что создаёт правовой риск.
  2. Нанять временный персонал — дорого и долго.
  3. Автоматизировать механический этап редактирования.

Вариант 3 теперь доступен. Та же пакетная обработка, которую используют федеральные ведомства, доступна юридическим службам округов. Длительных процедур закупок не требуется. Подробнее о том, как нормы о публичных документах применяются в разных юрисдикциях, см. в нашем обзоре соответствия.

Запросы DSAR в ЕС: та же проблема

Запросы субъектов данных (DSAR) по статье 15 GDPR создают аналогичную проблему для европейских организаций. В отличие от FOIA, обязательства по DSAR распространяются на все организации, обрабатывающие персональные данные. Небольшая SaaS-компания может получать столько же DSAR, сколько крупный банк.

Практическая проблема схожа с FOIA. Организация должна предоставить все данные, которые она хранит о конкретном лице. Персональные данные третьих лиц необходимо вычеркнуть из ответа. Срок — 30 дней.

Каждый DSAR, затрагивающий архивы электронной почты, обращения в поддержку и записи о заказах, может означать сотни документов для проверки. Для организаций, получающих 20–50 DSAR в месяц, ручная проверка требует одного или нескольких штатных сотрудников, занятых полный рабочий день. Пакетная автоматизация сокращает нагрузку до неполного рабочего дня.

Локальная обработка для конфиденциальных документов

Некоторые ведомства не могут использовать веб-инструменты. Данные, которые должны оставаться в системах ведомства, требуют локальной обработки.

Для этого сценария предназначено настольное приложение (anonym.plus):

  • Вся обработка выполняется на оборудовании ведомства.
  • Данные не передаются на внешние серверы.
  • Пакетная обработка выполняется для 1–5 000 файлов за раз.
  • Поддерживаемые форматы: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Обработанные файлы упаковываются в ZIP-архив.
  • Экспорт в CSV и JSON с метаданными по каждому файлу включён.

Для ведомств с изолированными сетями или строгими требованиями к резидентству данных локальная обработка — единственный жизнеспособный вариант. Настольное приложение использует ту же модель обнаружения — XLM-RoBERTa с 285+ типами сущностей, — что и веб-платформа. Оно работает полностью в автономном режиме.

См. документацию по настольному приложению для получения подробностей об установке.

Практические аспекты внедрения

Журналы аудита. Государственные рабочие процессы требуют записей о том, что было отредактировано, на каком основании и кем. Метаданные пакетной обработки охватывают первые два пункта. Маршрутизация исключительных документов через сотрудников закрывает остальное.

Согласованность. Ответ по FOIA, в котором имя вычеркнуто в одном документе, но пропущено в другом, создаёт правовую уязвимость. Фиксированная автоматизированная конфигурация устраняет такую несогласованность.

Материалы категории SBU. Многие государственные документы являются чувствительными, но не засекреченными. Локальная обработка справляется с файлами SBU без использования сети. Веб-обработка с надлежащими соглашениями об обработке данных охватывает файлы, не относящиеся к SBU.

Формат вывода. Метод Redact использует замену чёрными полосами. Это соответствует виду стандартного редактирования по FOIA и подходит для судебного производства. Токеновый подход — например, `[REDACTED - Exemption 6]` — добавляет явную ссылку на исключение для более детальных документов.

Главный вывод

FOIA — это правовая обязанность. Срок в 20 рабочих дней — не ориентир. Когда объём запросов превышает возможности персонала, неизбежны нарушения.

Пакетное редактирование на основе ИИ не заменяет юридической квалификации. Оно устраняет механический этап — поиск и маркировку стандартных персональных данных в тысячах документов. На этот этап уходит 70–80% времени проверки. Сотрудники могут сосредоточиться на 10–20% документов, где важен контекст.

ARPA-H и HHS/CMS оба пришли к этому выводу. Органы власти штатов и муниципалитеты, а также европейские организации, сталкивающиеся с обязательствами по DSAR, стоят перед той же проблемой. Подробнее о том, как структурируются защищаемые рабочие процессы редактирования, см. в обзоре безопасности и соответствия.

Источники

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.