FOIA: La IA reduce el tiempo de redacción de semanas a horas
Actualizado para 2026.
El gobierno federal de EE. UU. gastó aproximadamente 500 millones de dólares en el procesamiento de solicitudes FOIA en 2024. La mayor parte de ese costo fue redacción manual. El retraso del DOJ superó las 100.000 solicitudes abiertas.
ARPA-H emitió una licitación en 2025 para software de redacción con IA. HHS encontró que su división CMS necesitaba herramientas basadas en IA. El trabajo manual había creado retrasos que el personal no podía resolver.
La pregunta ha cambiado. Ya no se trata de si las agencias deben automatizar. Se trata de cómo hacerlo de forma que los resultados sean defendibles ante los tribunales.
El problema del retraso federal
Según 5 U.S.C. §552, las agencias deben responder dentro de 20 días hábiles. En la práctica, muchas tardan meses. Algunas tardan años.
El retraso del DOJ de más de 100.000 solicitudes equivale a aproximadamente 2 mil millones de minutos de revisión manual. Eso asume solo 20 minutos por solicitud. A las tarifas gubernamentales, el costo laboral asciende a miles de millones.
La mayor parte de ese tiempo se dedica a una sola tarea. El personal revisa páginas en busca de nombres, direcciones y números de teléfono. Ese trabajo no requiere criterio jurídico. Requiere reconocimiento de patrones. Un algoritmo lo realiza en segundos.
Lo que ARPA-H y HHS requirieron
ARPA-H buscó software de redacción con IA para el procesamiento de documentos FOIA. Los requisitos declarados cubrían cinco áreas:
- Identificación automática de datos personales bajo las exenciones 6 y 7(C).
- Procesamiento por lotes de grandes conjuntos de documentos.
- Compatibilidad con formatos mixtos: PDF, Word y correo electrónico.
- Documentación del rastro de auditoría.
- Resultados defendibles para respuestas FOIA.
HHS/CMS llegó a la misma conclusión. El crecimiento de volúmenes y la plantilla estable hicieron insostenible la revisión manual. Estas agencias no buscaban nueva tecnología por sí misma. Resolvían una crisis de cumplimiento.
Gobiernos locales: menos recursos, las mismas obligaciones
Las agencias federales tienen oficinas FOIA dedicadas y presupuestos legales. Los gobiernos estatales y locales enfrentan las mismas obligaciones legales con muchos menos recursos.
La CPRA de California exige respuestas en 10 días calendario. Un condado con un equipo legal de tres personas no puede procesar 2.000 documentos manualmente en ese plazo. Las opciones son limitadas:
- Denegar o retrasar — lo que crea riesgo legal.
- Contratar personal temporal — costoso y lento de incorporar.
- Automatizar la fase de redacción mecánica.
La opción 3 ya es viable. El mismo procesamiento por lotes que usan las agencias federales está disponible para los departamentos legales municipales. Sin largos plazos de contratación. Nuestra guía de cumplimiento explica cómo se aplican las normas de registros públicos en distintas jurisdicciones.
DSARs en la UE: el mismo problema
Las solicitudes de acceso a datos personales (DSAR) del artículo 15 del RGPD crean un desafío paralelo para las organizaciones europeas. A diferencia del FOIA, las obligaciones DSAR aplican a todas las organizaciones que procesan datos personales. Una pequeña empresa SaaS puede recibir el mismo volumen de DSARs que un gran banco.
El desafío práctico refleja el FOIA. Una organización debe entregar todos los datos que tiene sobre una persona concreta. Los datos personales de terceros deben redactarse de la respuesta. El plazo es de 30 días.
Cada DSAR que toca archivos de correo, tickets de soporte y registros de pedidos puede suponer cientos de documentos. Para organizaciones que gestionan 20–50 DSARs al mes, la revisión manual requiere uno o más empleados a tiempo completo. La automatización por lotes reduce eso a trabajo a tiempo parcial.
Procesamiento en escritorio para registros sensibles
Algunas agencias no pueden usar herramientas web. Los datos que deben permanecer en los sistemas de la agencia necesitan procesamiento local.
La aplicación de escritorio (anonym.plus) está diseñada para este caso de uso:
- Todo el procesamiento se ejecuta en el hardware propio de la agencia.
- No se envían datos a servidores externos.
- Los lotes procesan entre 1 y 5.000 archivos a la vez.
- Formatos compatibles: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
- Los archivos procesados se empaquetan como un archivo ZIP.
- Se incluye exportación CSV y JSON con metadatos por archivo.
Para agencias con redes aisladas o reglas estrictas de residencia de datos, el procesamiento local es el único camino viable. La aplicación de escritorio usa el mismo modelo de detección — XLM-RoBERTa con más de 285 tipos de entidades — que la plataforma web. Completamente sin conexión.
La documentación de la aplicación de escritorio contiene los detalles de configuración.
Notas de implementación
Rastros de auditoría. Los flujos de trabajo gubernamentales requieren registros de qué se redactó, en qué base y por quién. Los metadatos del procesamiento por lotes cubren los dos primeros. El enrutamiento de documentos de excepción hacia el personal cubre el resto.
Consistencia. Una respuesta FOIA que redacta un nombre en un documento pero lo omite en otro crea exposición legal. Una configuración automatizada fija elimina esa inconsistencia.
Materiales SBU. Muchos documentos gubernamentales son sensibles pero no clasificados. El procesamiento local maneja archivos SBU sin uso de red. El procesamiento web con los acuerdos de tratamiento de datos apropiados cubre los archivos no SBU.
Formato de salida. El método Redactar usa reemplazo con barra negra. Esto coincide con el aspecto de las redacciones FOIA estándar y es adecuado para producción judicial. El enfoque de token — como [REDACTADO - Exención 6] — añade cita de exención explícita para documentación más detallada.
Conclusión
El FOIA es una obligación legal. El plazo de 20 días hábiles no es una aspiración. Cuando los volúmenes de solicitudes superan lo que el personal puede manejar manualmente, siguen fallos sistemáticos.
La redacción por lotes con IA no reemplaza el criterio jurídico. Elimina la fase mecánica — encontrar y marcar datos personales estándar en miles de documentos. Esa fase consume del 70 al 80% del tiempo de revisión. El personal puede entonces concentrarse en el 10–20% de documentos donde el contexto importa.
ARPA-H y HHS/CMS lo reconocieron. Los gobiernos locales y las organizaciones europeas con obligaciones DSAR enfrentan el mismo desafío. Nuestra guía de seguridad y cumplimiento explica cómo se estructuran los flujos de redacción defendibles.