By · Last updated 2026-05-28

Povratak na BlogTehnički

FOIA: AI redakcija smanjuje tjedne cekanja na sate

Americka savezna vlada potrosila je procijenjenih 500 milijuna dolara na obradu FOIA zahtjeva u 2024., uglavnom na rucnu redakciju. ARPA-H je izricito trazio softver za AI redakciju.

May 28, 20268 min čitanja
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: AI smanjuje redakciju s tjedana na sate

Azurirano za 2026.

Americka savezna vlada potrosila je procijenjenih 500 milijuna dolara na obradu FOIA zahtjeva u 2024. Vecina tog troska bila je rucna redakcija. Zaostaci DOJ-a presli su 100.000 otvorenih zahtjeva.

ARPA-H je 2025. pokrenuo nabavu softvera za AI redakciju. HHS je utvrdio da njegov CSD odjel treba alate s podrzanom AI. Rucni rad stvorio je zaostake koje osoblje nije moglo rjesiti.

Pitanje se promijenilo. Vise nije o tome treba li automatizirati. Radi se o tome kako to uciniti na nacin koji ce se odrzati na sudu.

Problem federalnih zaostaka

Prema 5 U.S.C. 552, agencije moraju odgovoriti u roku od 20 radnih dana. U praksi, mnoge traze mjesece. Neke traze godine.

Zaostatak DOJ-a od 100.000+ zahtjeva jednak je otprilike 2 milijarde minuta rucnog pregleda. To pretpostavlja samo 20 minuta po zahtjevu. Po drzavnim stopama naplacivanja, troskovi rada ulaze u milijarde.

Vecina tog vremena ide na jedan zadatak. Osoblje pregledava stranice u potrazi za imenima, adresama i brojevima telefona. To ne zahtijeva pravnu prosudbu odvjetnika. Zahtijeva podudaranje uzoraka. Algoritam to radi u sekundama.

Sto su trazili ARPA-H i HHS

ARPA-H je trazio softver za AI redakciju za obradu FOIA dokumenata. Navedeni zahtjevi bili su:

  • Automatska identifikacija osobnih podataka prema Iznimkama 6 i 7(C).
  • Grupna obrada velikih skupova dokumenata.
  • Podrska za mijesane formate: PDF, Word i e-posta.
  • Dokumentacija revizijskog traga.
  • Obranjivi rezultat za FOIA odgovor.

HHS/CMS dosao je do istog zakljucka. Rastuci volumeni i nepromijenjeno osoblje ucinili su rucni pregled neodrzivim. Ove agencije nisu trazile novu tehnologiju. Rjesavale su krizu uskladjenosti.

Drzavne i lokalne vlasti: manje resursa, ista pravila

Savezne agencije imaju namjenske FOIA urede i pravne proracune. Drzavne i lokalne vlasti suocavaju se s istim pravnim obvezama s daleko manje resursa.

Kalifornijski CPRA zahtijeva odgovore u roku od 10 kalendarskih dana. Okrug s troclanim pravnim timom ne moze pregledati 2.000 dokumenata u tom vremenskom okviru. Mogucnosti su ogranicene:

  1. Odbiti ili odgoditi - sto stvara pravni rizik.
  2. Zaposliti privremeno osoblje - skupo i sporo.
  3. Automatizirati fazu mehanicke redakcije.

Mogucnost 3 sada je dostizna. Ista grupna obrada koju koriste savezne agencije dostupna je okruznim pravnim odjelima. Nisu potrebni dugi rokovi nabave. Pogledajte nas pregled uskladjenosti za to kako se pravila javnih evidencija primjenjuju u raznim jurisdikcijama.

EU DSAR-ovi: isti problem

Zahtjevi ispitanika za pristup podacima (DSAR) prema GDPR clanku 15 stvaraju paralelni izazov za EU organizacije. Za razliku od FOIA, DSAR obveze primjenjuju se na sve organizacije koje rukuju osobnim podacima. Mala SaaS tvrtka moze primiti isti volumen DSAR-ova kao velika banka.

Prakticki izazov odrazava FOIA. Organizacija mora proizvesti sve podatke koji se drzavaju o odredjenoj osobi. Osobni podaci trecih strana moraju biti redaktirani iz odgovora. Rok je 30 dana.

Svaki DSAR koji dira arhive e-poste, zahtjeve za podrsku i zapise narudzbi moze znaciti stotine dokumenata za provjeru. Za organizacije koje obradjuju 20-50 DSAR-ova mjesecno, rucni pregled zahtijeva jednog ili vise zaposlenika na puno radno vrijeme. Grupna automatizacija to svodi na posao s nepunim radnim vremenom.

Lokalna obrada za osjetljive zapise

Neke agencije ne mogu koristiti web-bazirane alate. Podaci koji moraju ostati unutar agencijskih sustava trebaju lokalnu obradu.

Desktop App (anonym.plus) je napravljen za ovaj slucaj koristenja:

  • Sva obrada izvodi se na agencijskom vlastitom hardveru.
  • Nikakvi podaci ne salju se vanjskim posluziteljima.
  • Grupne operacije obradjuju 1 do 5.000 datoteka odjednom.
  • Podrzani formati: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Obradjene datoteke pakiraju se kao ZIP arhiva.
  • Ukljucen je CSV i JSON izvoz s metapodacima po datoteci.

Za agencije s izoliranim mrezama ili strogim pravilima o rezidenciji podataka, lokalna obrada je jedini izvedivi put. Desktop App koristi isti model detekcije - XLM-RoBERTa s 285+ vrsta entiteta - kao web platforma. Radi potpuno izvan mreze.

Pogledajte nasu dokumentaciju Desktop App-a za detalje postavljanja.

Napomene o implementaciji

Revizijski tragovi. Vladini tijekovi rada zahtijevaju evidenciju o tome sto je redaktirano, na kojoj osnovi i od koga. Grupni metapodaci pokrivaju prva dva. Usmjeravanje izuzetnih dokumenata kroz pregled osoblja pokriva ostatak.

Dosljednost. FOIA odgovor koji redaktira ime u jednom dokumentu, ali ga propusta u drugom, stvara pravnu izlozenost. Fiksna automatizirana konfiguracija uklanja tu nedosljednost.

SBU materijali. Mnogi vladini dokumenti su osjetljivi, ali neklasificirani. Lokalna obrada rukuje SBU datotekama bez koristenja mreze. Web-bazirana obrada s odgovarajucim DPA sporazumima pokriva ne-SBU datoteke.

Format izlaza. Metoda Redact koristi zamjenu crnom trakom. To odgovara izgledu standardnih FOIA redakcija i pogodno je za produkciju na sudu. Token pristup - kao sto je [REDACTED - Exemption 6] - dodaje eksplicitno citiranje iznimke za detaljnije zapise.

Kljucna poruka

FOIA je zakonska obveza. Rok od 20 radnih dana nije cilj. Kada volumeni zahtjeva premasuju ono sto osoblje moze obraditi, dolazi do propusta.

AI grupna redakcija ne zamjenjuje pravnu prosudbu. Uklanja mehanicku fazu - pronalazak i oznacavanje standardnih osobnih podataka u tisucama dokumenata. Ta faza trosila 70-80% vremena pregleda. Osoblje se zatim moze usredotociti na 10-20% dokumenata gdje kontekst ima znacaj.

ARPA-H i HHS/CMS su to prepoznali. Drzavne i lokalne vlasti i EU organizacije koje se suocavaju s DSAR obvezama suocavaju se s istim izazovom. Pogledajte nas pregled sigurnosti i uskladjenosti za to kako su strukturirani obranjivi tijekovi rada redakcije.

Izvori

Spremni za zaštitu vaših podataka?

Započnite anonimizaciju PII-a s 285+ vrsta entiteta na 48 jezika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.