By · Last updated 2026-05-28

Volver al BlogTécnico

FOIA en la Era de la IA: Cómo las Agencias Están...

El gobierno federal gastó un estimado de $500M en el procesamiento de FOIA en 2024, principalmente en redacción manual.

May 28, 20268 min de lectura
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: La IA reduce el tiempo de redacción de semanas a horas

Actualizado para 2026.

El gobierno federal de EE. UU. gastó aproximadamente 500 millones de dólares en el procesamiento de solicitudes FOIA en 2024. La mayor parte de ese costo fue redacción manual. El retraso del DOJ superó las 100.000 solicitudes abiertas.

ARPA-H emitió una licitación en 2025 para software de redacción con IA. HHS encontró que su división CMS necesitaba herramientas basadas en IA. El trabajo manual había creado retrasos que el personal no podía resolver.

La pregunta ha cambiado. Ya no se trata de si las agencias deben automatizar. Se trata de cómo hacerlo de forma que los resultados sean defendibles ante los tribunales.

El problema del retraso federal

Según 5 U.S.C. §552, las agencias deben responder dentro de 20 días hábiles. En la práctica, muchas tardan meses. Algunas tardan años.

El retraso del DOJ de más de 100.000 solicitudes equivale a aproximadamente 2 mil millones de minutos de revisión manual. Eso asume solo 20 minutos por solicitud. A las tarifas gubernamentales, el costo laboral asciende a miles de millones.

La mayor parte de ese tiempo se dedica a una sola tarea. El personal revisa páginas en busca de nombres, direcciones y números de teléfono. Ese trabajo no requiere criterio jurídico. Requiere reconocimiento de patrones. Un algoritmo lo realiza en segundos.

Lo que ARPA-H y HHS requirieron

ARPA-H buscó software de redacción con IA para el procesamiento de documentos FOIA. Los requisitos declarados cubrían cinco áreas:

  • Identificación automática de datos personales bajo las exenciones 6 y 7(C).
  • Procesamiento por lotes de grandes conjuntos de documentos.
  • Compatibilidad con formatos mixtos: PDF, Word y correo electrónico.
  • Documentación del rastro de auditoría.
  • Resultados defendibles para respuestas FOIA.

HHS/CMS llegó a la misma conclusión. El crecimiento de volúmenes y la plantilla estable hicieron insostenible la revisión manual. Estas agencias no buscaban nueva tecnología por sí misma. Resolvían una crisis de cumplimiento.

Gobiernos locales: menos recursos, las mismas obligaciones

Las agencias federales tienen oficinas FOIA dedicadas y presupuestos legales. Los gobiernos estatales y locales enfrentan las mismas obligaciones legales con muchos menos recursos.

La CPRA de California exige respuestas en 10 días calendario. Un condado con un equipo legal de tres personas no puede procesar 2.000 documentos manualmente en ese plazo. Las opciones son limitadas:

  1. Denegar o retrasar — lo que crea riesgo legal.
  2. Contratar personal temporal — costoso y lento de incorporar.
  3. Automatizar la fase de redacción mecánica.

La opción 3 ya es viable. El mismo procesamiento por lotes que usan las agencias federales está disponible para los departamentos legales municipales. Sin largos plazos de contratación. Nuestra guía de cumplimiento explica cómo se aplican las normas de registros públicos en distintas jurisdicciones.

DSARs en la UE: el mismo problema

Las solicitudes de acceso a datos personales (DSAR) del artículo 15 del RGPD crean un desafío paralelo para las organizaciones europeas. A diferencia del FOIA, las obligaciones DSAR aplican a todas las organizaciones que procesan datos personales. Una pequeña empresa SaaS puede recibir el mismo volumen de DSARs que un gran banco.

El desafío práctico refleja el FOIA. Una organización debe entregar todos los datos que tiene sobre una persona concreta. Los datos personales de terceros deben redactarse de la respuesta. El plazo es de 30 días.

Cada DSAR que toca archivos de correo, tickets de soporte y registros de pedidos puede suponer cientos de documentos. Para organizaciones que gestionan 20–50 DSARs al mes, la revisión manual requiere uno o más empleados a tiempo completo. La automatización por lotes reduce eso a trabajo a tiempo parcial.

Procesamiento en escritorio para registros sensibles

Algunas agencias no pueden usar herramientas web. Los datos que deben permanecer en los sistemas de la agencia necesitan procesamiento local.

La aplicación de escritorio (anonym.plus) está diseñada para este caso de uso:

  • Todo el procesamiento se ejecuta en el hardware propio de la agencia.
  • No se envían datos a servidores externos.
  • Los lotes procesan entre 1 y 5.000 archivos a la vez.
  • Formatos compatibles: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Los archivos procesados se empaquetan como un archivo ZIP.
  • Se incluye exportación CSV y JSON con metadatos por archivo.

Para agencias con redes aisladas o reglas estrictas de residencia de datos, el procesamiento local es el único camino viable. La aplicación de escritorio usa el mismo modelo de detección — XLM-RoBERTa con más de 285 tipos de entidades — que la plataforma web. Completamente sin conexión.

La documentación de la aplicación de escritorio contiene los detalles de configuración.

Notas de implementación

Rastros de auditoría. Los flujos de trabajo gubernamentales requieren registros de qué se redactó, en qué base y por quién. Los metadatos del procesamiento por lotes cubren los dos primeros. El enrutamiento de documentos de excepción hacia el personal cubre el resto.

Consistencia. Una respuesta FOIA que redacta un nombre en un documento pero lo omite en otro crea exposición legal. Una configuración automatizada fija elimina esa inconsistencia.

Materiales SBU. Muchos documentos gubernamentales son sensibles pero no clasificados. El procesamiento local maneja archivos SBU sin uso de red. El procesamiento web con los acuerdos de tratamiento de datos apropiados cubre los archivos no SBU.

Formato de salida. El método Redactar usa reemplazo con barra negra. Esto coincide con el aspecto de las redacciones FOIA estándar y es adecuado para producción judicial. El enfoque de token — como [REDACTADO - Exención 6] — añade cita de exención explícita para documentación más detallada.

Conclusión

El FOIA es una obligación legal. El plazo de 20 días hábiles no es una aspiración. Cuando los volúmenes de solicitudes superan lo que el personal puede manejar manualmente, siguen fallos sistemáticos.

La redacción por lotes con IA no reemplaza el criterio jurídico. Elimina la fase mecánica — encontrar y marcar datos personales estándar en miles de documentos. Esa fase consume del 70 al 80% del tiempo de revisión. El personal puede entonces concentrarse en el 10–20% de documentos donde el contexto importa.

ARPA-H y HHS/CMS lo reconocieron. Los gobiernos locales y las organizaciones europeas con obligaciones DSAR enfrentan el mismo desafío. Nuestra guía de seguridad y cumplimiento explica cómo se estructuran los flujos de redacción defendibles.

Fuentes

¿Listo para proteger sus datos?

Comience a anonimizar PII con más de 285 tipos de entidades en 48 idiomas.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.