anonym.legal

By · Last updated 2026-05-28

Povratak na blogTehnička

FOIA: AI smanjuje redakciju sa nedelja na sate

Federalna vlada potrosila je procenjenih 500 miliona dolara na obradu FOIA zahteva u 2024. godini, uglavnom na rucnu redakciju. ARPA-H je eksplicitno trazio AI softver za redakciju kako bi resio rastuce zaostake.

May 28, 20268 min čitanja
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: AI smanjuje redakciju sa nedelja na sate

Azurirano za 2026. godinu.

Federalna vlada potrosila je procenjenih 500 miliona dolara na obradu FOIA zahteva u 2024. godini. Vecina tog troskova bila je rucna redakcija. DOJ zaostaci presli su 100.000 otvorenih zahteva.

ARPA-H je 2025. godine izdao nabavku za AI softver za redakciju. HHS je otkrio da je njegova CMS divizija potrebovala alate zasnovane na vestackoj inteligenciji. Rucni rad stvorio je zaostake koje osoblje nije moglo da razresi.

Pitanje se promenilo. Vise nije o tome da li treba automatizovati. Radi se o tome kako to uraditi na nacin koji ce ostati validan na sudu.

Problem federalnih zaostaka

Prema 5 U.S.C. sekciji 552, agencije moraju odgovoriti u roku od 20 radnih dana. U praksi, mnoge odgovaraju mesecima. Neke godinama.

DOJ zaostaci od 100.000+ zahteva jednaki su priblizno 2 milijarde minuta rucnog pregleda. To pretpostavlja samo 20 minuta po zahtevu. Po vladinim tarifama naplate, trosak rada ide u milijarde.

Vecina tog vremena odlazi na jedan zadatak. Osoblje skenira stranice u potrazi za imenima, adresama i brojevima telefona. To ne zahteva pravnu procenu. Zahteva prepoznavanje obrazaca. Algoritam to radi za sekunde.

Sta su ARPA-H i HHS zahtevali

ARPA-H trazio je AI softver za redakciju za obradu FOIA dokumenata. Navedeni zahtevi bili su:

  • Automatska identifikacija licnih podataka iz izuzeca 6 i 7(C).
  • Grupna obrada velikih skupova dokumenata.
  • Podrska za misovite formate: PDF, Word i email.
  • Dokumentacija revizijskog traga.
  • Odbranljiv izlaz za FOIA odgovor.

HHS/CMS dosao je do istog zakljucka. Rastuce kolicine i nepromenjeno osoblje ucinili su rucni pregled neodrzivilm. Ove agencije nisu jurile novu tehnologiju. Resavale su krizu komplijansa.

Drzavne i lokalne vlasti: manje resursa, ista pravila

Federalne agencije imaju namenska FOIA odeljenja i pravne budzete. Drzavne i lokalne vlasti suocavaju se sa istim zakonskim obavezama uz daleko manje resursa.

Kalifornijski CPRA zahteva odgovore u roku od 10 kalendarskih dana. Okrug sa trojna pravni tim ne moze da prodje kroz 2.000 dokumenata u tom roku. Opcije su ogranicene:

  1. Odbiti ili odloziti - sto stvara pravni rizik.
  2. Zaposliti privremeno osoblje - skupo i sporo.
  3. Automatizovati fazu mehanicke redakcije.

Opcija 3 je sada dostupna. Ista grupna obrada koju koriste federalne agencije dostupna je okruznim pravnim odeljenjima. Nisu potrebni dugi vremenski rokovi nabavke. Pogledajte nas pregled komplijansa za primenu pravila o javnim evidencijama u razlicitim nadleznostima.

EU DSAR zahtevi: isti problem

GDPR clan 15 Zahtevi za pristup subjektu podataka (DSAR) stvaraju paralelni izazov za EU organizacije. Za razliku od FOIA, obaveze DSAR-a odnose se na sve organizacije koje upravljaju licnim podacima. Mala SaaS firma moze primiti isti obim DSAR zahteva kao velika banka.

Prakticni izazov odrazava FOIA. Organizacija mora da posalje sve podatke koji se cuvaju o odredjenoj osobi. Licni podaci trecih strana moraju biti redaktovani iz odgovora. Rok je 30 dana.

Svaki DSAR koji obuhvata arhive elektronske poste, tikete za podrsku i zapise o narudzbinama moze znaciti stotine dokumenata za proveru. Za organizacije koje obraduju 20-50 DSAR zahteva mesecno, rucni pregled zahteva jednog ili vise zaposlenih na puno radno vreme. Automatizacija grupne obrade to svodi na posao sa skracenim radnim vremenom.

Desktop obrada za osetljive zapise

Neke agencije ne mogu koristiti web-zasnovane alate. Podaci koji moraju ostati unutar agencijskih sistema zahtevaju lokalnu obradu.

Desktop aplikacija (anonym.plus) napravljena je za ovaj slucaj upotrebe:

  • Sva obrada se vrsi na sopstvenom hardveru agencije.
  • Nijedni podaci se ne salju na spoljne servere.
  • Grupne operacije obraduju 1-5.000 fajlova odjednom.
  • Podrzani formati: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Obradjeni fajlovi se pakuju kao ZIP arhiva.
  • Ukljucen je CSV i JSON izvoz sa metapodacima po fajlu.

Za agencije sa izolovane mrezama ili strogim pravilima o rezidenciji podataka, lokalna obrada je jedini odrzivi put. Desktop aplikacija koristi isti model detekcije - XLM-RoBERTa sa 285+ tipova entiteta - kao web platforma. Radi potpuno offline.

Pogledajte nasu dokumentaciju Desktop aplikacije za detalje podesavanja.

Napomene o implementaciji

Revizijski tragovi. Vladini tokovi posla zahtevaju zapise o tome sta je redaktovano, na kom osnovu i od koga. Metapodaci grupne obrade pokrivaju prve dve stavke. Preusmeravanje dokumenata sa izuzecima kroz pregled osoblja pokriva ostatak.

Doslednost. FOIA odgovor koji redaktuje ime u jednom dokumentu ali ga propusta u drugom stvara pravnu izlozenost. Fiksna automatizovana konfiguracija uklanja tu nedoslednost.

SBU materijali. Mnogi vladini dokumenti su osetljivi ali neklasifikovani. Lokalna obrada rukuje SBU fajlovima bez koriscenja mreze. Web-zasnovana obrada sa odgovarajucim DPA sporazumima pokriva non-SBU fajlove.

Format izlaza. Metoda Redact koristi zamenu crnom trakom. Ovo odgovara izgledu standardnih FOIA redakcija i pogodno je za sudsku produkciju. Token pristup - kao sto je [REDACTED - Exemption 6] - dodaje eksplicitnu citaciju izuzeca za detaljnije zapise.

Zakljucak

FOIA je zakonska obaveza. Rok od 20 radnih dana nije cilj. Kada obim zahteva premasuje ono sto osoblje moze da obradi, dolazi do propusta.

AI-zasnovana grupna redakcija ne zamenjuje pravnu procenu. Ona uklanja mehanicku fazu - pronalazenje i obelezavanje standardnih licnih podataka u hiljadama dokumenata. Ta faza trosi 70-80% vremena pregleda. Osoblje se zatim moze fokusirati na 10-20% dokumenata gde kontekst je vazan.

ARPA-H i HHS/CMS su ovo prepoznali. Drzavne i lokalne vlasti i EU organizacije koje se suocavaju sa DSAR obavezama suocavaju se sa istim izazovom. Pogledajte nas pregled bezbednosti i komplijansa za nacin na koji su strukturirani odbranljivi tokovi redakcije.

Izvori

Spremni da zaštitite svoje podatke?

Počnite sa anonimizacijom PII sa 285+ tipova entiteta na 48 jezika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.