人工智能时代的FOIA:机构如何将审查时间从数周缩短至数小时
联邦政府在2024年估计花费了5亿美元用于FOIA处理。大部分是手动审查。司法部的FOIA积压超过了100,000个请求。卫生与公共服务部(HHS)记录显示,其CMS部门探索使用人工智能驱动的审查,因为手动处理造成了不可接受的积压。ARPA-H在2025年明确寻求人工智能审查软件,以“利用人工智能进行审查并利用电子发现进行尽职调查”。
认识到手动FOIA审查无法扩展现在已成为制度化。问题已从“我们是否应该自动化?”转变为“我们如何实施能够产生可辩护、可在法庭上接受的输出的自动化?”
联邦FOIA积压危机
根据5 U.S.C. §552,联邦机构必须在20个工作日内回应FOIA请求。机构可以以“特殊情况”为由,通知请求者延长截止日期。实际上,许多机构的响应时间以月到年计,而不是以天计。
司法部的100,000多个请求的积压代表了大约20亿分钟的手动审查时间,如果每个请求仅涉及20分钟的审查。按照政府的计费标准,这意味着数十亿美元的劳动力——大部分用于机械识别和审查标准的个人身份信息(PII)。
推动积压的请求并不是需要律师判断的复杂法律问题。它们是文档密集型请求,其中80%的工作是在数千页上用荧光笔寻找姓名、地址和电话号码——这项工作算法可以在几秒钟内完成。
ARPA-H和HHS的认识
ARPA-H(高级研究项目局)发布了一项采购,寻求专门设计用于处理FOIA文档处理的人工智能审查软件。要求包括:
- 自动识别和审查FOIA豁免6和7(C)的个人身份信息
- 大型文档集的批量处理
- 混合格式支持(PDF、Word、电子邮件格式)
- 审计跟踪文档
- 适合FOIA响应的可辩护输出
HHS/CMS在其运营审查中记录了类似的要求,指出请求量的增长与静态人员配置的结合使得手动处理在数学上不可持续。
这些机构并不是为了追求尖端的人工智能而追求人工智能。它们是面临法定合规危机的机构,并认识到解决方案需要自动化。
州和地方政府:被忽视的问题
联邦政府的FOIA挑战虽然庞大,但资源充足——机构有专门的FOIA办公室,有法律审查预算,并且有既定的工作流程。州和地方政府面临相同的法定义务,但资源却少得多。
加利福尼亚州的CPRA(加利福尼亚公共记录法)要求在10个日历日内作出回应。一个拥有3人法律团队的县无法在这个时间窗口内通过手动审查处理2,000份文档的记录请求。选择有:
- 拒绝或延迟(造成法律风险)
- 为大型请求雇佣临时法律人员(费用高,入职慢)
- 自动化机械审查阶段
选项3现在是可行的。联邦机构可用的相同批量处理能力也可供县法律部门使用,而无需企业采购时间表。
欧盟成员国DSAR:相同的问题,不同的管辖权
GDPR第15条数据主体访问请求(DSAR)为欧盟组织带来了类似的挑战。与FOIA(政府特定)不同,DSAR义务适用于所有处理个人数据的组织。一家年收入1,000万欧元的SaaS公司可能会收到与大型企业相同数量的DSAR,但资源却更少。
实际的DSAR挑战与FOIA相似:在30天内提供关于特定个人的所有数据,并在响应中删除第三方的个人身份信息。每个涉及电子邮件档案、支持票据和订单记录的DSAR可能需要审查数百份文档以进行第三方审查。
对于每月收到20-50个DSAR的组织——这一水平需要一个或多个全职员工专门负责DSAR响应,按照当前的手动处理速度——批量自动化将其减少为兼职工作。
桌面应用程序:离线政府处理
处理机密或敏感记录的政府机构面临着网络工具无法解决的限制:数据不能离开机构基础设施。
桌面应用程序(anonym.plus)直接解决了这一问题:
- 所有处理都在机构的硬件上本地进行
- 不会将数据传输到外部服务器
- 每次运行批量处理1-5,000个文件
- 混合格式支持:PDF、DOCX、XLSX、TXT、CSV、JSON、XML
- 处理文件的ZIP打包
- 带有每个文件处理元数据的CSV/JSON导出
对于拥有隔离网络或严格数据驻留要求的机构,本地处理不是可选项——这是唯一可行的方法。桌面应用程序在离线环境中提供相同的检测准确性(XLM-RoBERTa,285+实体类型)。
政府环境中的实施考虑
审计跟踪要求: 政府审查工作流程需要记录审查了什么,基于什么,由谁,何时进行。批量操作的处理元数据提供前两个元素。通过审查工作流程(由机构工作人员进行的例外审查)提供后两个元素。
文档集的一致性: FOIA响应在某些文档中审查了姓名而在其他文档中没有审查,这会造成法律风险。使用一致配置的自动化处理消除了不同审查员施加不同判断所引入的不一致性。
敏感但未分类(SBU)处理: 许多政府文件是SBU而不是机密的。本地处理可以处理SBU材料而无需网络传输。在符合适当DPA协议的欧盟托管服务器上进行的基于网络的处理可以处理非SBU材料。
法庭可接受的审查格式: Redact方法(黑条替换)与传统FOIA审查的物理外观相匹配,适合法庭可接受的生产。替换令牌方法([REDACTED - Exemption 6])与明确的豁免引用提供了更细致的文档。
结论
FOIA是法定要求。20个工作日的响应截止日期不是期望的——未能遵守会造成法律风险和DPA/法庭干预。当请求量超过手动处理的能力时,系统性失败随之而来。
人工智能驱动的批量审查并不取代机构的法律判断。它消除了机械阶段——在数万份文档中识别和删除标准的个人身份信息——这占据了70-80%的审查时间。机构法律人员重新专注于10-20%的例外文档,这些文档的上下文是重要的。
ARPA-H认识到了这一点。HHS/CMS也认识到了这一点。面临最大积压的机构正在朝着自动化迈进。对于面临DSAR义务的州和地方政府以及欧盟组织,同样的解决方案适用。
来源: