anonym.legal

By · Last updated 2026-05-28

Назад на блоготТехнички

FOIA: Редакција од недели до часови

Федералната влада потрошила проценети $500M на обработка на FOIA во 2024 година, главно рачна редакција. ARPA-H изречно барал AI софтвер за редакција за да го реши огромниот заостаток.

May 28, 20268 мин читање
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: AI ја намалува редакцијата од недели до часови

Ажурирано за 2026 година.

Федералната влада потрошила проценети $500M на обработка на FOIA во 2024 година. Поголемиот дел од тој трошок беше рачна редакција. Заостатокот на DOJ надмина 100.000 отворени барања.

ARPA-H издаде набавка во 2025 година за AI софтвер за редакција. HHS утврди дека неговата дивизија CMS треба алатки со AI поддршка. Рачната работа создаде заостатоци кои вработените не можеа да ги исчистат.

Прашањето се промени. Повеќе не е дали да се автоматизира. Тоа е за тоа како да се направи на начин кој е одржлив на суд.

Проблемот со федералниот заостаток

Според 5 U.S.C. §552, агенциите мора да одговорат во рок од 20 работни дена. Во пракса, многу одговараат во текот на месеци. Некои во текот на години.

Заостатокот на DOJ од 100.000+ барања е еднаков на приближно 2 милијарди минути рачен преглед. Тоа претпоставува само 20 минути по барање. По владините стапки на наплата, трошокот за труд достигнува милијарди.

Поголемиот дел од тоа време оди на една задача. Вработените ги прегледуваат страниците за имиња, адреси и телефонски броеви. Тоа не бара адвокатско расудување. Бара препознавање на шаблони. Алгоритам тоа го прави за секунди.

Што бараа ARPA-H и HHS

ARPA-H барал AI софтвер за редакција за обработка на документи за FOIA. Нивните наведени барања беа:

  • Автоматско идентификување на лични податоци според Исклучок 6 и 7(C).
  • Обработка во пакет на големи збирки документи.
  • Поддршка за мешан формат: PDF, Word и е-пошта.
  • Документација за ревизорска трага.
  • Одбранлив резултат за одговор на FOIA.

HHS/CMS дојде до истиот заклучок. Растечките количини и рамен кадар ја направи рачниот преглед неодржлив. Овие агенции не јурат нова технологија. Тие решаваат криза на усогласеност.

Државни и локални власти: помалку ресурси, исти правила

Федералните агенции имаат посветени канцеларии за FOIA и правни буџети. Државните и локалните влади се соочуваат со исти правни обврски со многу помалку ресурси.

CPRA на Калифорнија бара одговори во рок од 10 календарски дена. Округ со правен тим од три лица не може да обработи 2.000 документи во тој временски прозорец. Опциите се ограничени:

  1. Одбивање или одложување - создава правен ризик.
  2. Вработување привремен персонал - скапо и бавно.
  3. Автоматизирање на механичката фаза на редакција.

Опцијата 3 е сега достапна. Истата обработка во пакет која ја користат федералните агенции е достапна за правните служби на округот. Не се потребни долги временски рокови за набавка. Погледнете го нашиот преглед на усогласеноста за тоа како правилата за јавни записи се применуваат низ јурисдикции.

ЕУ DSAR: Истиот проблем

Барањата за пристап на субјектот на GDPR според член 15 (DSAR) создаваат паралелен предизвик за организациите во ЕУ. За разлика од FOIA, DSAR обврските се однесуваат на сите организации кои ракуваат со лични податоци. Мала SaaS фирма може да прими ист обем на DSAR колку и голема банка.

Практичниот предизвик го одразува FOIA. Организацијата мора да ги произведе сите податоци кои ги чува за конкретно лице. Личните податоци на трети страни мора да бидат редактирани од одговорот. Рокот е 30 дена.

Секој DSAR кој допира архиви на е-пошта, билети за поддршка и записи за нарачки може да значи стотици документи за проверка. За организации кои обработуваат 20-50 DSAR месечно, рачниот преглед бара еден или повеќе вработени со полно работно време. Автоматизацијата во пакет го намалува тоа на работа со скратено работно време.

Десктоп обработка за чувствителни записи

Некои агенции не можат да користат веб-базирани алатки. Податоците кои мора да останат во системите на агенцијата бараат локална обработка.

Десктоп апликацијата (anonym.plus) е изградена за овој случај на употреба:

  • Сета обработка се изврши на сопствениот хардвер на агенцијата.
  • Никакви податоци не се испраќаат до надворешни сервери.
  • Серијската обработка обработува 1-5.000 датотеки одеднаш.
  • Поддржани формати: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Обработените датотеки се пакувани во ZIP архива.
  • Вклучен е CSV и JSON извоз со метаподатоци по датотека.

За агенции со воздушно изолирани мрежи или строги правила за резиденција на податоци, локалната обработка е единствениот одржлив пат. Десктоп апликацијата го користи истиот модел за откривање - XLM-RoBERTa со 285+ типови на ентитети - како веб-платформата. Работи целосно офлајн.

Погледнете ја нашата документација за десктоп апликацијата за детали за поставување.

Белешки за имплементација

Ревизорски траги. Владините работни текови бараат записи за тоа што е редактирано, на каква основа и од кого. Метаподатоците за пакет ги покриваат првите два. Рутирањето на исклучителни документи преку преглед на персоналот го покрива остатокот.

Конзистентност. Одговор на FOIA кој редактира ime во еден документ, но го пропушта во друг создава правна изложеност. Фиксирана автоматизирана конфигурација ја отстранува таа недоследност.

SBU материјали. Многу владини документи се чувствителни, но некласифицирани. Локалната обработка ги обработува SBU датотеките без употреба на мрежа. Веб-базираната обработка со соодветни DPA договори ги покрива не-SBU датотеките.

Формат на излез. Методот Redact користи замена со црна лента. Ова го одговара изгледот на стандардните редакции на FOIA и е погодно за производство во суд. Токен пристапот - на пример [REDACTED - Exemption 6] - додава изречна цитација за исклучок за подетални записи.

Заклучок

FOIA е правна обврска. Рокот од 20 работни дена не е цел. Кога обемот на барања ги надминува можностите на вработените, следуваат неуспеси.

АI-напредната редакција во пакет не го заменува правното расудување. Ја отстранува механичката фаза - наоѓање и означување на стандардни лични податоци низ илјадници документи. Таа фаза троши 70-80% од времето за преглед. Вработените потоа можат да се фокусираат на 10-20% од документите каде контекстот е важен.

ARPA-H и HHS/CMS двете го виделе ова. Државните и локалните власти и организациите во ЕУ кои се соочуваат со DSAR обврски се соочуваат со истиот предизвик. Погледнете го нашиот преглед на безбедноста и усогласеноста за тоа како се структурирани работните текови за одбранлива редакција.

Извори

Подготвени да ги заштитите вашите податоци?

Започнете со анонимизација на PII со 285+ типови на ентитети на 48 јазици.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.