anonym.legal

By · Last updated 2026-05-28

Nazaj na blogTehnično

FOIA: Redakcija v urah namesto tednih z umetno inteligenco

Zvezna vlada ZDA je leta 2024 porabila ocenjenih 500 milijonov dolarjev za obdelavo FOIA, vecinoma rocno redakcijo. ARPA-H je izrecno iskala programsko opremo za redakcijo z UI za resevanje narasajocega zaostanka.

May 28, 20268 min branja
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: Umetna inteligenca skrajsa redakcijo iz tednov na ure

Posodobljeno za leto 2026.

Zvezna vlada ZDA je leta 2024 porabila ocenjenih 500 milijonov dolarjev za obdelavo FOIA. Vecina tega stroska je bila rocna redakcija. Zaostanki DOJ so presli 100.000 odprtih zahtev.

ARPA-H je leta 2025 objavila javno narocilo za programsko opremo za redakcijo z UI. HHS je ugotovil, da njegova enota CMS potrebuje orodja na osnovi UI. Rocno delo je ustvarilo zaostanke, ki jih osebje ni moglo odpraviti.

Vprasanje se je spremenilo. Ne gre vec za to, ali avtomatizirati. Gre za to, kako to storiti na nacin, ki zdrzi na sodiscu.

Problem zveznega zaostanka

Po 5 U.S.C. SS552 morajo agencije odgovoriti v 20 delovnih dneh. V praksi mnogi vzamejo mesece. Nekateri vzamejo leta.

Zaostanek DOJ pri 100.000+ zahtevah je enak priblizno 2 milijardama minut rocnega pregleda. To predpostavlja le 20 minut na zahtevo. Pri vladnih cenah dela strosek doseze milijarde.

Vecina tega casa gre za eno nalogo. Osebje skenira strani za imenami, naslovi in telefonskimi stevilkami. To ne zahteva presoje odvetnika. Zahteva ujemanje vzorcev. Algoritem to naredi v sekundah.

Zahteve ARPA-H in HHS

ARPA-H je iskala programsko opremo za redakcijo z UI za obdelavo dokumentov FOIA. Njihove navedene zahteve so bile:

  • Samodejna identifikacija osebnih podatkov po Izjemah 6 in 7(C).
  • Paketna obdelava velikih sklopov dokumentov.
  • Podpora za mesane formate: PDF, Word in e-posta.
  • Dokumentacija revizijske sledi.
  • Zagovorljiv izhod za odgovor FOIA.

HHS/CMS je prisla do istega sklepa. Rastoce kolicine in enako osebje sta naredila rocni pregled nevzdrzen. Te agencije niso zasledovale novih tehnologij. Resevale so skladnostno krizo.

Drzavne in lokalne ravni: manj virov, enaka pravila

Zvezne agencije imajo namenska pisarna FOIA in pravne proracune. Drzavne in lokalne vlade imajo enake pravne obveznosti z veliko manj viri.

Kalifornijski CPRA zahteva odgovore v 10 koledarskih dneh. Okrozje s trijclansko pravno ekipo ne more pregledati 2.000 dokumentov v tem casovnem okviru. Moznosti so omejene:

  1. Zavrnitev ali zamuda - kar ustvarja pravno tveganje.
  2. Zaposlitev zacasnega osebja - drago in pocasi.
  3. Avtomatizacija faze mehanicne redakcije.

Moznost 3 je zdaj dosegljiva. Enaka paketna obdelava, ki jo uporabljajo zvezne agencije, je na voljo okroznim pravnim oddelkom. Ni potrebnih dolgih postopkov javnega narocanja. Glejte nas pregled skladnosti za to, kako pravila o javnih evidencah veljajo v razlicnih jurisdikcijah.

Zahteve DSAR po EU: Isti problem

Zahteve za dostop do podatkov (DSAR) po 15. clenu GDPR ustvarjajo vzporeden izziv za organizacije v EU. Za razliko od FOIA obveznosti DSAR veljajo za vse organizacije, ki obravnavajo osebne podatke. Majhno podjetje SaaS lahko prejme enako kolicino DSAR kot velika banka.

Prakticni izziv je vzporeden z FOIA. Organizacija mora zagotoviti vse podatke, ki jih hrani o doloceni osebi. Osebne podatke tretjih oseb je treba redaktirati iz odgovora. Rok je 30 dni.

Vsak DSAR, ki se dotika arhivov e-poste, vstopnic za podporo in evidenc narocil, lahko pomeni stotine dokumentov za pregled. Za organizacije, ki obravnavajo 20-50 DSAR na mesec, rocni pregled zahteva enega ali vec zaposlenih s polnim delovnim casom. Paketna avtomatizacija to zmanjsa na delo s krajsim delovnim casom.

Namizna obdelava za obcutljive evidence

Nekatere agencije ne morejo uporabljati spletnih orodij. Podatki, ki morajo ostati znotraj sistemov agencije, potrebujejo lokalno obdelavo.

Namizna aplikacija (anonym.plus) je zasnovana za ta primer uporabe:

  • Vsa obdelava poteka na lastni strojni opremi agencije.
  • Nobeni podatki niso poslani na zunanje streznika.
  • Paketni zagoni obravnavajo 1-5.000 datotek naenkrat.
  • Podprti formati: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Obdelane datoteke so pakirane kot arhiv ZIP.
  • Vkljucen je izvoz CSV in JSON z metapodatki na datoteko.

Za agencije z omrezji brez dostopa do interneta ali strogimi pravili glede rezidencnosti podatkov je lokalna obdelava edina izvedljiva pot. Namizna aplikacija uporablja isti model zaznavanja - XLM-RoBERTa z 285+ vrstami entitet - kot spletna platforma. Deluje popolnoma brez povezave.

Glejte naso dokumentacijo namizne aplikacije za podrobnosti nastavitve.

Implementacijske opombe

Revizijske sledi. Vladni poteki dela zahtevajo evidence o tem, kaj je bilo redigirano, na kaksni podlagi in s strani koga. Metapodatki paketov pokrijejo prva dva. Usmerjanje izjemnih dokumentov prek pregleda osebja pokrije ostalo.

Doslednost. Odgovor FOIA, ki redaktira ime v enem dokumentu, v drugem pa ga prezre, ustvarja pravno izpostavljenost. Fiksna avtomatizirana konfiguracija odpravi to nedoslednost.

Gradivo SBU. Mnogi vladni dokumenti so obcutljivi, a neklasificirani. Lokalna obdelava obravnava datoteke SBU brez uporabe omrezja. Spletna obdelava z ustreznimi sporazumi DPA pokriva datoteke, ki niso SBU.

Format izhoda. Metoda Redact uporablja zamenjavo s crno vrstico. To ustreza videzu standardnih redakcij FOIA in je primerno za sodno produkcijo. Pristop z znacko - na primer [REDACTED - Exemption 6] - doda eksplicitno navedbo izjeme za bolj podrobne evidence.

Zakljucek

FOIA je pravna obveznost. Rok 20 delovnih dni ni cilj. Ko kolicine zahtev presezejo zmogljivosti osebja, sledijo neuspehi.

Redakcija v paketih z UI ne nadomesti pravne presoje. Odstrani mehansko fazo - iskanje in oznacevanje standardnih osebnih podatkov v tisocih dokumentov. Ta faza porabi 70-80% casa pregleda. Osebje se lahko nato osredotoci na 10-20% dokumentov, kjer je kontekst pomemben.

ARPA-H in HHS/CMS sta oba to videla. Drzavne in lokalne vlade ter organizacije v EU, ki se soocajo z obveznostmi DSAR, se soocajo z enakim izzivom. Glejte nas pregled varnosti in skladnosti za to, kako so strukturirani poteki dela z zagovorljivo redakcijo.

Viri

Ste pripravljeni zaščititi svoje podatke?

Začnite z anonimizacijo PII z več kot 285 tipi entitet v 48 jezikih.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.