By · Last updated 2026-05-28

返回博客技术

FOIA:AI将编辑时间从数周缩短至数小时

联邦政府2024年在FOIA处理上的估计支出达5亿美元,主要用于人工编辑。ARPA-H明确采购AI编辑软件以解决积压问题,自动化预筛可将审核工时减少70%至80%。

May 28, 20268 分钟阅读
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA:AI将编辑时间从数周缩短至数小时

2026年更新版

联邦政府2024年在FOIA处理上的估计支出达5亿美元,大部分为人工编辑成本。司法部积压案件超过10万件。

ARPA-H于2025年发布AI编辑软件采购公告;HHS发现其CMS部门需要AI驱动工具,人工处理已造成工作人员无法清理的积压。

问题已经转变。争议不再是是否要自动化,而是如何以经得起法律审查的方式实现自动化。

联邦积压问题

根据5 U.S.C. §552,各机构必须在20个工作日内作出回应。在实践中,许多机构需要数月,有些甚至需要数年。

司法部超过10万件积压请求,按每件仅20分钟估算,等于约20亿分钟的人工审核。按政府计费率,劳动成本高达数十亿美元。

大部分时间用于一项任务:工作人员逐页扫描姓名、地址和电话号码。这不需要律师判断,只需要模式匹配,而算法在数秒内即可完成。

ARPA-H和HHS的要求

ARPA-H为FOIA文件处理寻求AI编辑软件,明确要求包括:

  • 自动识别豁免6和7(C)条款下的个人数据
  • 大批量文件的批量处理
  • 混合格式支持:PDF、Word和电子邮件
  • 审计追踪文档
  • 可用于FOIA回应的可靠输出

HHS/CMS得出相同结论——不断增长的处理量与固定的人员编制使人工审核难以为继。这些机构并非追逐新技术,而是在解决合规危机。

州和地方政府:资源更少,义务相同

联邦机构有专职FOIA办公室和法律预算,而州和地方政府面临同等法律义务却资源匮乏得多。

加利福尼亚州的CPRA要求在10个日历日内作出回应。一个只有三人法律团队的县政府无法在此时限内处理2000份文件。可选方案十分有限:

  1. 拒绝或延迟——带来法律风险
  2. 聘用临时人员——成本高昂且耗时
  3. 将机械性编辑阶段自动化

第3项选择现已触手可及。联邦机构使用的批量处理同样适用于县级法律部门,无需漫长的采购流程。请参阅我们的合规概览,了解公共档案规则如何适用于各司法管辖区。

欧盟DSAR:同样的难题

GDPR第15条数据主体访问请求(DSAR)对欧盟组织构成类似挑战。与FOIA不同,DSAR义务适用于所有处理个人数据的组织。一家小型SaaS公司收到的DSAR数量可能与大型银行相当。

实际挑战与FOIA如出一辙。组织必须提供其持有的关于特定个人的所有数据,同时需要编辑回应中的第三方个人数据,且期限为30天。

涉及电子邮件归档、支持工单和订单记录的每份DSAR,可能需要审查数百份文件。对于每月处理20至50份DSAR的组织,人工审核需要一名或多名全职员工,而批量自动化可将其降至兼职工作量。

本地处理敏感记录

部分机构无法使用网络工具。必须留在机构系统内的数据需要本地处理。

桌面应用程序(anonym.plus)专为此场景设计:

  • 所有处理在机构自有硬件上运行
  • 不向外部服务器发送数据
  • 批量处理每次可处理1至5000个文件
  • 支持格式:PDF、DOCX、XLSX、TXT、CSV、JSON、XML
  • 处理后的文件打包为ZIP压缩包
  • 包含每个文件元数据的CSV和JSON导出

对于使用隔离网络或有严格数据本地化要求的机构,本地处理是唯一可行路径。桌面应用程序使用与Web平台相同的检测模型——支持285+实体类型的XLM-RoBERTa,可完全离线运行。

请参阅我们的桌面应用程序文档了解安装详情。

实施说明

审计追踪。 政府工作流程需要记录编辑了什么、依据是什么、由谁执行。批量元数据涵盖前两项,将例外文件路由至工作人员审核覆盖其余部分。

一致性。 FOIA回应在一份文件中编辑了某个姓名,却在另一份文件中遗漏,会带来法律风险。固定的自动化配置消除了这种不一致性。

敏感但非涉密(SBU)材料。 许多政府文件属于敏感但非涉密类别。本地处理可在不使用网络的情况下处理SBU文件;配合适当数据处理协议(DPA)的基于Web的处理适用于非SBU文件。

输出格式。 「编辑」方法使用黑色方块替换,与标准FOIA编辑外观一致,适合法庭提交。Token方式——如`[REDACTED - Exemption 6]`——为更详细的记录添加明确的豁免引用。

结论

FOIA是法律义务,20个工作日的期限不是目标,而是要求。当请求量超过工作人员处理能力时,违规便随之而来。

AI批量编辑不能取代法律判断,它消除的是机械性阶段——在数千份文件中查找和标记标准个人数据。这一阶段占用了70%至80%的审核时间。工作人员因此可以将精力集中在真正需要判断的10%至20%的文件上。

ARPA-H和HHS/CMS都认识到了这一点。面临DSAR义务的州、地方政府和欧盟组织面临同样的挑战。请参阅我们的安全合规概览,了解如何构建可靠的编辑工作流程。

参考资料

准备好保护您的数据了吗?

开始使用 285 种实体类型在 48 种语言中匿名化 PII。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.