By · Last updated 2026-05-28

Späť na blogTechnické

FOIA: AI skrati redakciu z tyzdenov na hodiny

Federalna vlada minula odhadovanych 500 miliard dolarov na spracovanie FOIA v roku 2024, vacsinou na manualnu redakciu. ARPA-H explicitne hladala softer na redakciu s AI.

May 28, 20268 min čítania
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: AI skrati redakciu z tyzdenov na hodiny

Aktualizovane pre rok 2026.

Federalna vlada minula odhadovanych 500 miliard dolarov na spracovanie FOIA v roku 2024. Vacsia cast tychto nakladov bola manualana redakcia. Nedostatky DOJ prekrocili 100 000 otvorených ziadosti.

ARPA-H vydala v roku 2025 zakazku na softer na redakciu s pomocou AI. HHS zistilo, ze jej divyzia CMS potrebuje nastroje pohanane AI. Manualana praca vytvorila nedostatky, ktore personel nedokazal zvladnut.

Otazka sa zmenila. Uz nie je o tom, ci automatizovat. Je o tom, ako to robit sposobom, ktory obstoji na sude.

Problem federalnych nedostatkov

Podla 5 U.S.C. §552 musia agentury reagovat do 20 pracovnych dni. V praxi mnoge potrebuju mesiace. Niektore roky.

Nedostatok DOJ viac ako 100 000 ziadosti sa rovna priblizne 2 miliardám minut manualnej revize. To predpoklada len 20 minut na ziadost. Pri vladnych sadzbach nakladov na pracovnu silu to vychodzi na miliardy.

Vacsia cast tohto casu ide na jednu ulohu. Personaalt prechadzaa stranky hladajuc mena, adresy a telefonne cisla. To nevyzaduje pravnicke posudenie. Vyzaduje to zhodu vzorov. Algoritmus to zvladne v sekundach.

Co pozadovali ARPA-H a HHS

ARPA-H hladala softer na redakciu AI pre spracovanie dokumentov FOIA. Ich uvadzane poziadavky boli:

  • Automaticka identifikacia osobnych udajov podla Vynimky 6 a 7(C).
  • Davkove spracovanie velkych sad dokumentov.
  • Podpora mixovanych formatov: PDF, Word a email.
  • Dokumentacia auditnej stopy.
  • Obhajitelny vystup pre odpoved FOIA.

HHS/CMS doslo k rovnakemu zaveru. Rastuce objemy a stabilny pocet personalu robili manualnu revizu neudrzatelnou. Tieto agentury neprehladiavali novu technologiu. Riesili krizu sulade s predpismi.

Statne a miestne: Menej zdrojov, rovnake pravidla

Federalne agentury maju vyhradene kancalarie FOIA a pravne rozpocty. Statne a miestne vlady celia rovnakym pravnym povinnostiam s omnoho menspimi zdrojmi.

CPRA Kalifornie vyzaduje odpovede do 10 kalendarnych dni. Okres s trojclennym pravnym timom nedokazge preist 2 000 dokumentov v tomto okne. Moznosti su obmedzene:

  1. Zamietnut alebo odlozit - co vytvara pravne riziko.
  2. Najat docasny personalaalt - drahé a pomale.
  3. Automatizovat mechanicku fazu redakcie.

Moznost 3 je teraz v dosahu. Rovnake davkove spracovanie, ake pouzivaju federalne agentury, je dostupne pre pravne oddelenia okrskov. Nevyzaduju sa dlhe lehoty obstaravania. Pozrite si nase prehlad sulade s predpismi pre informacie o tom, ako sa pravidla verejnych zaznamov uplatnovaju napriec jurisdikciami.

Europske DSARy: Rovnaky problem

Ziadosti dotknutych osob (DSARy) podla GDPR clanku 15 vytvaraju paralelnú vyzvu pre organizacie v EU. Na rozdiel od FOIA, povinnosti DSAR sa vzfahuju na vsetky organizacie, ktore narábaju s osobnymi udajmi. Mala SaaS firma moze dostat rovnaky objem DSARov ako velka banka.

Prakticka vyzva zrkadli FOIA. Organizacia musi poskytnout vsetky udaje o konkretnej osobe. Osobne udaje tretich stran musia byt z odpovede vymazane. Lehota je 30 dni.

Kazdy DSAR dotykajuci sa emailovych archivov, supportovych listkov a zaznamov objednavok moze znamenat stovky dokumentov na kontrolu. Pre organizacie spracovavajuce 20-50 DSARov mesacne manualana reviza vyzaduje jedneho alebo viac zamestnancov na plny uvazok. Davkova automatizacia to znizi na praci na cast uvazku.

Desktopove spracovanie pre citlive zaznamy

Niektore agentury nemozu pouzivat webove nastroje. Udaje, ktore musia zostat v systemoch agentury, potrebuju miestne spracovanie.

Desktopova aplikacia (anonym.plus) je pre tento pripad pouzitia vytvorena:

  • Vsetko spracovanie bezi na vlastnom hardveri agentury.
  • Ziadne udaje sa neposielaju na externe servery.
  • Davkove spustenia spracovavaju 1 - 5 000 suborov naraz.
  • Podporovane formaty: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Spracovane subory su zabalene ako archiv ZIP.
  • CSV a JSON export s metadatami na subor su zahrnuté.

Pre agentury s airgap sietami alebo prismymi pravidlami residencie udajov je miestne spracovanie jedinou schudnou cestou. Desktopova aplikacia pouziva rovnaky model detekcie - XLM-RoBERTa s 285+ typmi entit - ako webova platforma. Funguje plne offline.

Pozrite si nasu dokumentaciu Desktopovej aplikacie pre podrobnosti o nastaveni.

Poznamky k implementacii

Auditne stopy. Vladne pracovne toky vyzaduju zaznamy o tom, co bolo vymazane, na akom zaklade a kym. Metadataavkoveho spracovania pokryvaju prve dve. Smerovanie vynimocnych dokumentov cez revizu personalu pokryva zvysok.

Konzistentnost. Odpoved FOIA, ktora vymazeva meno v jednom dokumente, ale premeska ho v inom, vytvara pravnu expozicia. Pevna automatizovana konfiguracia odstranujet tuto nekonzistentnost.

Materiale SBU. Mnoho vladnych dokumentov je citlivych, ale neklasifikovanych. Miestne spracovanie spracovava subory SBU bez pouzitia siete. Webove spracovanie so spravnymi dohodami DPA pokryva subory, ktore nie su SBU.

Format vystupu. Metoda Redact pouziva nahradenie ciernymi pruhmi. To zodpoveda vzhlaadu standardnych redakcii FOIA a hodi sa na predkladanie sudom. Tokenovy pristup - ako [REDACTED - Exemption 6] - prida explicitnu citaciu vynimky pre podrobnejsie zaznamy.

Zaver

FOIA je pravna povinnost. Lehota 20 pracovnych dni nie je ciel. Ked objem ziadosti prekroci to, co moze personaalt zvladnut, nasleduju zlyhania.

Davkova redakcia pohanana AI nenahradzuje pravne posudenie. Odstranujet mechanicku fazu - hladanie a oznacovanie standardnych osobnych udajov napriec tisickami dokumentov. Tato faza spotrebovava 70-80% casu revize. Personaalt sa potom moze sustredit na 10-20% dokumentov, kde zalezi kontext.

ARPA-H a HHS/CMS to videli. Statne a miestne vlady a organizacie EU celia povinnostiam DSAR stoja pred rovnakou vyzvu. Pozrite si nas prehlad bezpecnosti a sulade s predpismi pre informacie o tom, ako su strukturovane obhajitelne pracovne toky redakcie.

Zdroje

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.