anonym.legal

By · Last updated 2026-05-28

Назад до блогуТехнічні

FOIA: ШІ скорочує редагування з тижнів до годин

Федеральний уряд витратив близько 500 млн доларів на обробку запитів FOIA у 2024 році, переважно на ручне редагування. ARPA-H прямо шукала програмне забезпечення для редагування на основі ШІ.

May 28, 20268 хв читання
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: ШІ скорочує редагування з тижнів до годин

Оновлено у 2026 році.

Федеральний уряд витратив близько 500 млн доларів на обробку запитів FOIA у 2024 році. Більшість цих витрат — ручне редагування. Черга DOJ перевищила 100 000 відкритих запитів.

ARPA-H оголосила закупівлю у 2025 році на програмне забезпечення для редагування за допомогою ШІ. HHS виявило, що її підрозділу CMS потрібні інструменти на базі ШІ. Ручна праця створила черги, з якими персонал не міг впоратися.

Питання змінилося. Тепер воно не про те, чи автоматизувати процес. А про те, як зробити це так, щоб це витримало судову перевірку.

Проблема федеральних черг

Згідно з 5 U.S.C. §552, відомства повинні відповісти протягом 20 робочих днів. На практиці багато з них відповідають місяцями. Деякі — роками.

Черга DOJ у 100 000+ запитів — це приблизно 2 мільярди хвилин ручного перегляду. З розрахунку лише 20 хвилин на запит. За урядовими ставками оплати праці витрати сягають мільярдів.

Більшість цього часу йде на одне завдання. Співробітники сканують сторінки в пошуках імен, адрес і номерів телефонів. Це не вимагає суддівського рішення. Це вимагає пошуку за шаблоном. Алгоритм робить це за секунди.

Що вимагали ARPA-H та HHS

ARPA-H шукала програмне забезпечення для ШІ-редагування документів FOIA. Заявлені вимоги:

  • Автоматичне виявлення персональних даних за Винятком 6 і 7(C).
  • Пакетна обробка великих наборів документів.
  • Підтримка змішаних форматів: PDF, Word та електронна пошта.
  • Документація журналу аудиту.
  • Придатний для суду результат для відповідей на FOIA.

HHS/CMS дійшло того ж висновку. Зростаючі обсяги та незмінний штат зробили ручний перегляд нежиттєздатним. Ці відомства не гналися за новими технологіями. Вони вирішували кризу відповідності.

Державний і місцевий рівень: менше ресурсів, ті ж правила

Федеральні відомства мають спеціалізовані офіси FOIA та юридичні бюджети. Органи влади штатів і місцевого самоврядування несуть ті ж правові зобов'язання з набагато меншими ресурсами.

Закон CPRA Каліфорнії вимагає відповіді протягом 10 календарних днів. Округ із трьома юристами не може переглянути 2 000 документів за цей термін. Варіантів небагато:

  1. Відмовити або затягувати — що створює правовий ризик.
  2. Наймати тимчасових співробітників — дорого і повільно.
  3. Автоматизувати механічну фазу редагування.

Варіант 3 тепер доступний. Та сама пакетна обробка, яку використовують федеральні відомства, доступна юридичним відділам округів. Без тривалих процедур закупівель. Дивіться наш огляд відповідності про те, як правила доступу до публічних записів застосовуються в різних юрисдикціях.

DSAR в ЄС: та сама проблема

Запити суб'єктів даних (DSAR) за Статтею 15 GDPR створюють паралельну проблему для організацій ЄС. На відміну від FOIA, зобов'язання DSAR поширюються на всі організації, що обробляють персональні дані. Мала SaaS-компанія може отримати той самий обсяг DSAR, що й великий банк.

Практична проблема відображає FOIA. Організація повинна надати всі дані про конкретну особу. Персональні дані третіх сторін мають бути відредаговані з відповіді. Термін — 30 днів.

Кожен DSAR, що стосується архівів електронної пошти, тікетів підтримки та записів про замовлення, може охоплювати сотні документів для перевірки. Для організацій, що обробляють 20–50 DSAR на місяць, ручний перегляд потребує одного або кількох штатних співробітників. Пакетна автоматизація скорочує це до часткової зайнятості.

Обробка на пристрої для чутливих записів

Деякі відомства не можуть використовувати веб-інструменти. Дані, що мають залишатися в системах відомства, потребують локальної обробки.

Десктопний застосунок (anonym.plus) створено саме для цього:

  • Вся обробка виконується на власному обладнанні відомства.
  • Жодні дані не надсилаються на зовнішні сервери.
  • Пакетна обробка — від 1 до 5 000 файлів за раз.
  • Підтримувані формати: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Оброблені файли упаковуються у ZIP-архів.
  • Включено експорт у CSV та JSON з метаданими на кожен файл.

Для відомств із ізольованими мережами або суворими правилами резидентності даних локальна обробка — єдиний придатний шлях. Десктопний застосунок використовує ту саму модель виявлення — XLM-RoBERTa з 285+ типами сутностей — що й вебплатформа. Він повністю працює офлайн.

Дивіться нашу документацію десктопного застосунку для деталей налаштування.

Нотатки щодо впровадження

Журнали аудиту. Урядові процеси вимагають записів про те, що було відредаговано, на якій підставі та ким. Метадані пакету охоплюють перше і друге. Маршрутизація виняткових документів через перевірку персоналом — третє.

Узгодженість. Відповідь на FOIA, яка редагує ім'я в одному документі, але пропускає його в іншому, створює правовий ризик. Фіксована автоматизована конфігурація усуває цю неузгодженість.

Матеріали SBU. Багато урядових документів є чутливими, але несекретними. Локальна обробка обслуговує файли SBU без використання мережі. Веббробка з відповідними угодами DPA покриває файли, що не є SBU.

Формат виведення. Метод Redact використовує заміну чорними смугами. Це відповідає вигляду стандартних редакцій FOIA і підходить для судового виробництва. Підхід із токеном — наприклад, [REDACTED - Exemption 6] — додає явне посилання на виняток для більш детальних записів.

Висновок

FOIA — це правовий обов'язок. Термін у 20 робочих днів — не мета. Коли обсяги запитів перевищують можливості персоналу, порушення неминучі.

Пакетне редагування на основі ШІ не замінює правового судження. Воно усуває механічну фазу — пошук і позначення стандартних персональних даних у тисячах документів. Ця фаза займає 70–80% часу перегляду. Персонал може зосередитися на 10–20% документів, де контекст має значення.

ARPA-H та HHS/CMS обидва це побачили. Державні й місцеві органи влади та організації ЄС, що стикаються з зобов'язаннями DSAR, мають ту саму проблему. Дивіться наш огляд безпеки та відповідності про те, як структуруються захищені процеси редагування.

Джерела

Готові захистити свої дані?

Почніть анонімізувати PII з 285+ типами сутностей на 48 мовах.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.