FOIA:AIが文書墨消し作業を数週間から数時間へ短縮
2026年版に更新済み。
米国連邦政府は2024年に、FOIAの処理に推定5億ドルを費やしました。そのコストの大半は手動による墨消し作業です。DOJの未処理件数は10万件を超えました。
ARPA-Hは2025年、AI墨消しソフトウェアの調達を公告しました。HHSは、CMS部門がAIを活用したツールを必要としていることを確認しました。手動処理が大量の未処理案件を生み出し、職員では対応しきれない状況になっていたためです。
問題の焦点が変わりました。もはや「自動化すべきか」という議論ではありません。「裁判所でも通用する出力を生み出せる自動化をどう実装するか」が問われています。
連邦政府の未処理問題
5 U.S.C. §552の規定により、機関は20営業日以内に回答しなければなりません。しかし実際には、数ヶ月かかることも珍しくありません。数年かかる機関もあります。
DOJの未処理件数10万件超は、手動レビュー換算で約20億分に相当します。これは1件あたり20分という最低限の見積もりです。政府の時間単価で換算すると、人件費は数十億ドル規模になります。
その大部分は単純作業です。職員が何千ページもの文書を見て、名前・住所・電話番号を探します。この作業に法的判断は不要です。パターン認識さえできれば十分です。アルゴリズムなら数秒で完了します。
ARPA-HとHHSが求めたもの
ARPA-HはFOIA文書処理向けのAI墨消しソフトウェアを求めました。要件として明示されたのは5分野です。
- 免除事由6および7(C)に該当する個人データの自動検出。
- 大規模文書セットのバッチ処理。
- PDF・Word・メールといった複数形式への対応。
- 監査証跡の文書化。
- FOIA回答に適した証拠能力のある出力。
HHS/CMSも同じ結論に達しました。増加する処理量と固定された人員では、手動レビューは維持不可能でした。これらの機関が求めたのは新技術の採用ではありません。法令遵守上の危機を解決することでした。
州・地方政府:リソースは少なく、義務は同じ
連邦機関には専任のFOIA部門と法務予算があります。州や地方自治体は、はるかに少ないリソースで同じ法的義務を果たさなければなりません。
カリフォルニア州のCPRAは10暦日以内の回答を義務付けています。3名の法務チームを持つ郡は、2,000件の文書をその期間内に手動処理することはできません。選択肢は限られています。
- 拒否または遅延させる — これは法的リスクを生みます。
- 大量案件に対応する臨時スタッフを雇う — 費用がかかり、研修にも時間がかかります。
- 機械的な墨消し作業を自動化する。
選択肢3は現実的になっています。連邦機関が利用しているのと同じバッチ処理が、市区町村の法務部門でも利用可能です。長い調達プロセスも不要です。各地域での公文書規則の適用については、コンプライアンス概要をご参照ください。
EUのDSAR:同じ問題
GDPRの第15条に基づくデータ主体アクセス要求(DSAR)は、EU組織にとって同様の課題をもたらします。FOIAとは異なり、DSARの義務は個人データを処理するすべての組織に適用されます。小規模なSaaS企業も大手銀行と同量のDSARを受け取ることがあります。
実務上の課題はFOIAと類似しています。組織は特定の個人に関して保有するすべてのデータを開示しなければなりません。回答からはサードパーティの個人データを墨消しする必要があります。期限は30日です。
メールアーカイブ・サポートチケット・注文データにまたがるDSARでは、数百件の文書確認が必要になることもあります。月20〜50件のDSARを処理する組織では、手動対応に1人以上のフルタイム担当者が必要です。バッチ自動化によりパートタイム規模に削減できます。
機密文書のデスクトップ処理
一部の機関はウェブツールを使用できません。機関内システムに留めなければならないデータには、ローカル処理が必要です。
デスクトップアプリ(anonym.plus)はまさにこのユースケースのために設計されています。
- すべての処理が機関自身のハードウェア上で実行される。
- データは外部サーバーに送信されない。
- バッチ処理は1〜5,000ファイルを一度に処理できる。
- 対応形式:PDF、DOCX、XLSX、TXT、CSV、JSON、XML。
- 処理済みファイルはZIPアーカイブにパッケージ化される。
- ファイルごとのメタデータを含むCSV・JSONエクスポートが付属。
エアギャップネットワークや厳格なデータ保管ルールを持つ機関にとって、ローカル処理が唯一の実行可能な手段です。デスクトップアプリはウェブプラットフォームと同じ検出モデル(XLM-RoBERTa、285以上のエンティティタイプ)を使用します。完全オフラインで動作します。
設定の詳細はデスクトップアプリのドキュメントをご覧ください。
実装上の注意点
監査証跡。 政府の処理フローでは、何が、どの根拠で、誰によって墨消しされたかの記録が必要です。バッチ処理のメタデータが最初の2項目をカバーします。例外文書を担当者によるレビューに回すことで残りの項目をカバーします。
一貫性。 ある文書では氏名を墨消しし、別の文書では見逃したFOIA回答は法的リスクを生みます。一定の自動化設定により、異なる担当者が生じさせる不整合を排除できます。
SBU資料。 多くの政府文書は機密ではないが取扱注意(SBU)です。ローカル処理はネットワークを使わずにSBUファイルを処理します。適切なデータ処理契約を結んだウェブベース処理は非SBUファイルに対応します。
出力形式。 墨消しメソッドは黒塗りバー置換を使用します。これは従来のFOIA墨消しの外観に合致し、裁判所への提出に適しています。[墨消し済 - 免除事由6]のようなトークン方式は、より詳細な記録のために明示的な免除根拠を付加します。
結論
FOIAは法的義務です。20営業日という期限は努力目標ではありません。案件数が手動処理の限界を超えると、組織的な失敗が生じます。
AIを活用したバッチ墨消しは法的判断を代替しません。機械的な作業フェーズ——数千の文書にわたる標準的な個人データの検出とマーキング——を除去します。そのフェーズはレビュー時間の70〜80%を消費しています。担当者は文脈と判断が重要な残り10〜20%に集中できるようになります。
ARPA-HとHHS/CMSはともにこれを認識しました。DSAR義務を負う州・地方自治体やEU組織も同じ課題を抱えています。証拠能力のある墨消しワークフローの構造については、セキュリティとコンプライアンスの概要をご覧ください。