By · Last updated 2026-05-28

Tornar al BlogTècnic

FOIA: La redaccio passa de setmanes a hores amb IA

El govern federal va gastar un estimat de 500 milions de dolars en processament FOIA el 2024, principalment en redaccio manual. ARPA-H va buscar expressament programari de redaccio amb IA per abordar els endarreriments.

May 28, 20268 min llegit
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: La IA redueix la redaccio de setmanes a hores

Actualitzat per al 2026.

El govern federal va gastar un estimat de 500 milions de dolars en processament FOIA el 2024. La major part d'aquest cost va ser la redaccio manual. L'endarreriment del DOJ va superar les 100.000 sol.licituds obertes.

ARPA-H va emetre una licitacio el 2025 per a programari de redaccio amb IA. HHS va constatar que la seva divisio CMS necessitava eines basades en IA. El treball manual havia creat endarreriments que el personal no podia gestionar.

La pregunta ha canviat. Ja no es tracta de si automatitzar. Es tracta de com fer-ho d'una manera que aguanti davant els tribunals.

El problema de l'endarreriment federal

Segons 5 U.S.C. 552, les agencies han de respondre en 20 dies habils. A la practica, moltes triguen mesos. Algunes triguen anys.

L'endarreriment del DOJ de mes de 100.000 sol.licituds equival a aproximadament 2.000 milions de minuts de revisio manual. Aixo assumeix nomes 20 minuts per sol.licitud. Als preus de facturacio governamentals, el cost laboral arriba als milers de milions.

La major part d'aquell temps va a una sola tasca. El personal escaneja pagines cercant noms, adreces i numeros de telefon. Aixo no requereix judici d'advocat. Requereix coincidencia de patrons. Un algorisme ho fa en segons.

Que van requerir ARPA-H i HHS

ARPA-H va buscar programari de redaccio amb IA per al processament de documents FOIA. Els seus requisits declarats eren:

  • Identificacio automatica de dades personals de les exempcions 6 i 7(C).
  • Processament per lots de grans conjunts de documents.
  • Suport per a formats mixtos: PDF, Word i correu electronic.
  • Documentacio de rastre d'auditoria.
  • Sortida defensable per a la resposta FOIA.

HHS/CMS va arribar a la mateixa conclusio. El creixement del volum i la plantilla estancada feien insostenible la revisio manual. Aquestes agencies no anaven darrere de nova tecnologia. Estaven resolent una crisi de compliment.

Administracio estatal i local: menys recursos, les mateixes normes

Les agencies federals compten amb oficines FOIA dedicades i pressupostos legals. Els governs estatals i locals tenen les mateixes obligacions legals amb molt menys recursos.

La CPRA de California requereix respostes en 10 dies naturals. Un comtat amb un equip legal de tres persones no pot revisar 2.000 documents en aquell termini. Les opcions son limitades:

  1. Denegar o retardar - la qual cosa crea risc legal.
  2. Contractar personal temporal - car i lent.
  3. Automatitzar la fase de redaccio mecanica.

L'opcio 3 esta ara a l'abast. El mateix processament per lots que utilitzen les agencies federals esta disponible per als departaments legals dels comtats. Sense llargs terminis de licitacio. Consulteu la nostra visio general de compliment sobre com s'apliquen les normes de registres publics en diverses jurisdiccions.

DSARs de la UE: el mateix problema

Les Sol.licituds d'Acces de Subjectes de Dades (DSARs) de l'article 15 del GDPR creen un repte parallel per a les organitzacions de la UE. A diferencia de FOIA, les obligacions de DSAR s'apliquen a totes les organitzacions que gestionen dades personals. Una petita empresa SaaS pot rebre el mateix volum de DSARs que un gran banc.

El repte practic s'assembla al FOIA. Una organitzacio ha de produir totes les dades que te sobre una persona especifica. Les dades personals de tercers s'han de redar de la resposta. El termini es de 30 dies.

Cada DSAR que abasti arxius de correu electronic, tickets de suport i registres de comandes pot significar centenars de documents a revisar. Per a organitzacions que gestionen entre 20 i 50 DSARs al mes, la revisio manual requereix un o mes empleats a temps complet. L'automatitzacio per lots ho redueix a treball a temps parcial.

Processament local per a registres sensibles

Algunes agencies no poden utilitzar eines basades al web. Les dades que han de romandre dins dels sistemes de l'agencia necessiten processament local.

L'aplicacio d'escriptori (anonym.plus) esta dissenyada per a aquest cas d'us:

  • Tot el processament s'executa al maquinari propi de l'agencia.
  • No s'envien dades a servidors externs.
  • Les execucions per lots gestionen entre 1 i 5.000 fitxers alhora.
  • Formats admesos: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Els fitxers processats es comprimeixen en un arxiu ZIP.
  • S'inclou exportacio CSV i JSON amb metadades per fitxer.

Per a agencies amb xarxes aillades o normes estrictes de residencia de dades, el processament local es l'unic cami viable. L'aplicacio d'escriptori utilitza el mateix model de deteccio - XLM-RoBERTa amb mes de 285 tipus d'entitat - que la plataforma web. Funciona totalment sense connexio.

Consulteu la nostra documentacio de l'aplicacio d'escriptori per obtenir detalls de configuracio.

Notes d'implementacio

Rastres d'auditoria. Els fluxos de treball governamentals requereixen registres del que es va redar, per quin motiu i per qui. Les metadades per lots cobreixen els dos primers punts. Enrutar els documents d'excepcio a traves de la revisio del personal cobreix la resta.

Consistencia. Una resposta FOIA que redacta un nom en un document pero no en un altre crea exposicio legal. Una configuracio automatitzada fixa elimina aquesta inconsistencia.

Materials SBU. Molts documents governamentals son sensibles pero no classificats. El processament local gestiona els fitxers SBU sense us de xarxa. El processament web amb acords DPA adequats cobreix els fitxers no SBU.

Format de sortida. El metode Redact utilitza la substitucio per barres negres. Aixo coincideix amb l'aspecte de les redaccions FOIA estandard i s'adequa a la produccio judicial. L'enfocament de tokens - com ara [REDACTED - Exempcio 6] - afegeix la cita explícita de l'exempcio per als registres mes detallats.

La conclusio

FOIA es una obligacio legal. El termini de 20 dies habils no es un objectiu. Quan els volums de sol.licituds superen el que el personal pot gestionar, es produeixen fallades.

La redaccio per lots amb IA no substitueix el judici legal. Elimina la fase mecanica - trobar i marcar dades personals estandard en milers de documents. Aquesta fase consumeix entre el 70 i el 80% del temps de revisio. El personal pot centrar-se llavors en el 10-20% dels documents on el context importa.

ARPA-H i HHS/CMS ho van veure tots dos. Els governs estatals i locals i les organitzacions de la UE que s'enfronten a obligacions DSAR estan davant el mateix repte. Consulteu la nostra visio general de seguretat i compliment sobre com s'estructuren els fluxos de treball de redaccio defensables.

Fonts

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.