anonym.legal

By · Last updated 2026-05-28

Назад към блогаТехнически

FOIA: Редакция от седмици до часове с AI

Федералното правителство е похарчило около 500 млн. долара за обработка на FOIA заявки през 2024 г., предимно за ръчна редакция. ARPA-H изрично е търсила AI софтуер за редакция.

May 28, 20268 мин. четене
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: AI намалява редакцията от седмици до часове

Актуализирано за 2026 г.

Федералното правителство е похарчило около 500 млн. долара за обработка на FOIA заявки през 2024 г. По-голямата част от тези разходи е за ръчна редакция. Изоставането на Министерството на правосъдието е преминало 100 000 отворени заявки.

ARPA-H е издала обществена поръчка за AI софтуер за редакция на документи по FOIA. HHS е установил, че неговото подразделение CMS се нуждае от инструменти с AI поддръжка. Ръчната работа е създала изоставания, с които персоналът не може да се справи.

Въпросът се е променил. Вече не става дума дали да се автоматизира. Въпросът е как да се направи по начин, издържащ в съда.

Проблемът с федералното изоставане

Според 5 U.S.C. параграф 552 агенциите трябва да отговорят в рамките на 20 работни дни. На практика много от тях отнемат месеци. Някои отнемат години.

Изоставането на Министерството на правосъдието от 100 000+ заявки е равно приблизително на 2 милиарда минути ръчен преглед. Това приема само 20 минути на заявка. При правителствени тарифи за труд разходите за работна ръка достигат милиарди.

По-голямата част от това време отива за една задача. Персоналът преглежда страниците за имена, адреси и телефонни номера. Това не изисква правна преценка. Изисква разпознаване на шаблони. Алгоритъмът го прави за секунди.

Какво са изисквали ARPA-H и HHS

ARPA-H е търсила AI софтуер за редакция за обработка на FOIA документи. Заявените изисквания са:

  • Автоматично разпознаване на лични данни по Изключение 6 и 7(В).
  • Пакетна обработка на големи набори от документи.
  • Поддръжка на смесени формати: PDF, Word и имейл.
  • Документация за одитна следа.
  • Доказуем изход за FOIA отговор.

HHS/CMS е достигнал до същото заключение. Нарастващите обеми и непроменящият се персонал правят ръчния преглед неустойчив. Тези агенции не са преследвали нова технология. Те са решавали криза на съответствието.

Щати и общини: По-малко ресурси, същите правила

Федералните агенции разполагат с специализирани FOIA отдели и правни бюджети. Щатските и местните власти имат същите правни задължения с много по-малко ресурси.

Законът CPRA на Калифорния изисква отговор в рамките на 10 календарни дни. Окръг с тричленен правен екип не може да обработи 2000 документа в този срок. Вариантите са ограничени:

  1. Отказване или забавяне -- което създава правен риск.
  2. Наемане на временен персонал -- скъпо и бавно.
  3. Автоматизиране на механичната фаза на редакцията.

Вариант 3 вече е постижим. Същата пакетна обработка, използвана от федералните агенции, е достъпна за окръжните правни отдели. Не са необходими дълги процедури за обществени поръчки. Вижте нашия преглед на съответствието за начина, по който правилата за публичните записи се прилагат в различни юрисдикции.

DSAR по ЕС GDPR: Същият проблем

Искания за достъп до данни (DSAR) по Член 15 от GDPR създават паралелно предизвикателство за организации в ЕС. За разлика от FOIA, задълженията по DSAR се прилагат за всички организации, обработващи лични данни. Малка SaaS фирма може да получи същия обем DSAR като голяма банка.

Практическото предизвикателство отразява FOIA. Организацията трябва да предостави всички данни, съхранявани за конкретно лице. Личните данни на трети страни трябва да бъдат редактирани от отговора. Крайният срок е 30 дни.

Всеки DSAR, засягащ имейл архиви, тикети за поддръжка и записи за поръчки, може да означава стотици документи за проверка. За организации, обработващи 20-50 DSAR месечно, ръчният преглед изисква един или повече щатни служители. Пакетната автоматизация намалява това до работа на непълно работно време.

Десктоп обработка за чувствителни записи

Някои агенции не могат да използват уеб базирани инструменти. Данните, които трябва да останат в рамките на агенциите, се нуждаят от локална обработка.

Десктоп приложението (anonym.plus) е създадено за този случай:

  • Цялата обработка се извършва на хардуера на агенцията.
  • Никакви данни не се изпращат до външни сървъри.
  • Пакетните изпълнения обработват 1-5000 файла наведнъж.
  • Поддържани формати: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Обработените файлове се пакетират като ZIP архив.
  • CSV и JSON експорт с метаданни за всеки файл са включени.

За агенции с изолирани мрежи или строги правила за местонахождение на данните, локалната обработка е единственият жизнеспособен път. Десктоп приложението използва същия модел за разпознаване -- XLM-RoBERTa с 285+ типа обекти -- като уеб платформата. Работи напълно офлайн.

Вижте нашата документация за десктоп приложението за подробности по настройката.

Бележки по внедряването

Одитни следи. Правителствените работни процеси изискват записи за това какво е редактирано, на какво основание и от кого. Пакетните метаданни покриват първите две. Насочването на документи с изключения към преглед от персонала покрива останалото.

Последователност. FOIA отговор, редактиращ дадено име в един документ, но пропускащ го в друг, създава правна уязвимост. Фиксирана автоматизирана конфигурация премахва тази непоследователност.

Чувствителни, но некласифицирани материали. Много правителствени документи са чувствителни, но некласифицирани. Локалната обработка работи с тях без използване на мрежа. Уеб-базираната обработка с подходящи споразумения за обработка на данни покрива некласифицираните файлове.

Изходен формат. Методът Redact използва замяна с черна лента. Това съответства на вида на стандартните FOIA редакции и е подходящо за представяне в съда. Подходът с токени -- например [REDACTED - Изключение 6] -- добавя изрично цитиране на изключението за по-подробни записи.

Изводи

FOIA е правно задължение. Срокът от 20 работни дни не е цел. Когато обемът на заявките надвишава капацитета на персонала, следват неуспехи.

AI-подпомаганата пакетна редакция не замества правната преценка. Тя премахва механичната фаза -- намиране и маркиране на стандартни лични данни в хиляди документи. Тази фаза поглъща 70-80% от времето за преглед. Персоналът може след това да се съсредоточи върху 10-20% от документите, при които контекстът е важен.

ARPA-H и HHS/CMS и двете видяха това. Щатските и местните власти и организациите от ЕС, изправени пред задължения по DSAR, са пред същото предизвикателство. Вижте нашия преглед на сигурността и съответствието за начина, по който са структурирани защитими работни процеси за редакция.

Източници

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.