By · Last updated 2026-05-28

Kembali ke BlogTeknis

FOIA: Redaksi dari Berminggu-minggu Menjadi Berjam-jam

Pemerintah federal menghabiskan sekitar $500 juta untuk pemrosesan FOIA pada tahun 2024, sebagian besar untuk redaksi manual. ARPA-H secara eksplisit mencari perangkat lunak redaksi berbasis AI.

May 28, 20268 menit baca
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: AI Memangkas Redaksi dari Berminggu-minggu Menjadi Berjam-jam

Diperbarui untuk 2026.

Pemerintah federal menghabiskan sekitar $500 juta untuk pemrosesan FOIA pada tahun 2024. Sebagian besar biaya itu untuk redaksi manual. Tunggakan DOJ melewati 100.000 permintaan yang masih terbuka.

ARPA-H mengeluarkan pengadaan pada tahun 2025 untuk perangkat lunak redaksi berbasis AI. HHS menemukan bahwa divisi CMS-nya membutuhkan alat bertenaga AI. Pekerjaan manual telah menciptakan tunggakan yang tidak bisa diselesaikan oleh staf.

Pertanyaannya sudah bergeser. Bukan lagi soal apakah perlu mengotomatiskan. Melainkan bagaimana melakukannya dengan cara yang bisa dipertahankan di pengadilan.

Masalah Tunggakan Federal

Berdasarkan 5 U.S.C. §552, lembaga harus merespons dalam 20 hari kerja. Dalam praktiknya, banyak yang membutuhkan berbulan-bulan. Beberapa butuh bertahun-tahun.

Tunggakan DOJ sebesar 100.000+ permintaan setara dengan sekitar 2 miliar menit tinjauan manual. Itu dengan asumsi hanya 20 menit per permintaan. Dengan tarif penagihan pemerintah, biaya tenaga kerja mencapai miliaran.

Sebagian besar waktu itu habis untuk satu tugas. Staf memindai halaman untuk menemukan nama, alamat, dan nomor telepon. Itu tidak membutuhkan penilaian pengacara. Itu butuh pencocokan pola. Sebuah algoritma melakukannya dalam hitungan detik.

Apa yang Dibutuhkan ARPA-H dan HHS

ARPA-H mencari perangkat lunak redaksi AI untuk pemrosesan dokumen FOIA. Persyaratan yang mereka nyatakan adalah:

  • Identifikasi otomatis data pribadi Pengecualian 6 dan 7(C).
  • Pemrosesan batch untuk set dokumen yang besar.
  • Dukungan format campuran: PDF, Word, dan email.
  • Dokumentasi jejak audit.
  • Output yang dapat dipertahankan untuk respons FOIA.

HHS/CMS sampai pada kesimpulan yang sama. Volume yang terus bertumbuh dan staf yang stagnan membuat tinjauan manual tidak dapat dipertahankan. Lembaga-lembaga ini tidak mengejar teknologi baru. Mereka memecahkan krisis kepatuhan.

Negara Bagian dan Lokal: Sumber Daya Lebih Sedikit, Aturan yang Sama

Lembaga federal memiliki kantor FOIA khusus dan anggaran hukum. Pemerintah negara bagian dan lokal menghadapi kewajiban hukum yang sama dengan sumber daya yang jauh lebih sedikit.

CPRA California mengharuskan respons dalam 10 hari kalender. Sebuah kabupaten dengan tim hukum tiga orang tidak bisa menyelesaikan 2.000 dokumen dalam jangka waktu itu. Pilihannya terbatas:

  1. Menolak atau menunda — yang menciptakan risiko hukum.
  2. Menyewa staf sementara — mahal dan lambat.
  3. Mengotomatiskan fase redaksi mekanis.

Opsi 3 kini sudah terjangkau. Pemrosesan batch yang sama yang digunakan lembaga federal tersedia untuk departemen hukum kabupaten. Tidak diperlukan proses pengadaan yang panjang. Lihat ikhtisar kepatuhan kami untuk cara aturan catatan publik berlaku di berbagai yurisdiksi.

DSAR EU: Masalah yang Sama

Permintaan Akses Subjek Data (DSAR) GDPR Pasal 15 menciptakan tantangan paralel bagi organisasi EU. Tidak seperti FOIA, kewajiban DSAR berlaku bagi semua organisasi yang menangani data pribadi. Sebuah firma SaaS kecil bisa menerima volume DSAR yang sama seperti bank besar.

Tantangan praktisnya serupa dengan FOIA. Sebuah organisasi harus menghasilkan semua data yang dipegang tentang orang tertentu. Data pribadi pihak ketiga harus diredaksi dari respons. Batas waktunya adalah 30 hari.

Setiap DSAR yang menyentuh arsip email, tiket dukungan, dan catatan pesanan bisa berarti ratusan dokumen untuk diperiksa. Bagi organisasi yang menangani 20–50 DSAR per bulan, tinjauan manual membutuhkan satu atau lebih staf penuh waktu. Otomatisasi batch mereduksinya menjadi pekerjaan paruh waktu.

Pemrosesan Desktop untuk Catatan Sensitif

Beberapa lembaga tidak dapat menggunakan alat berbasis web. Data yang harus tetap berada dalam sistem lembaga membutuhkan pemrosesan lokal.

Aplikasi Desktop (anonym.plus) dibuat untuk kasus penggunaan ini:

  • Semua pemrosesan berjalan di perangkat keras lembaga sendiri.
  • Tidak ada data yang dikirim ke server eksternal.
  • Batch berjalan menangani 1–5.000 file sekaligus.
  • Format yang didukung: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • File yang diproses dikemas sebagai arsip ZIP.
  • Ekspor CSV dan JSON dengan metadata per file disertakan.

Bagi lembaga dengan jaringan terisolasi atau aturan residensi data yang ketat, pemrosesan lokal adalah satu-satunya jalur yang layak. Aplikasi Desktop menggunakan model deteksi yang sama — XLM-RoBERTa dengan 285+ jenis entitas — seperti platform web. Berfungsi penuh secara offline.

Lihat dokumentasi Aplikasi Desktop untuk detail pengaturan.

Catatan Implementasi

Jejak audit. Alur kerja pemerintah membutuhkan catatan tentang apa yang diredaksi, atas dasar apa, dan oleh siapa. Metadata batch mencakup dua hal pertama. Merutekan dokumen pengecualian melalui tinjauan staf mencakup sisanya.

Konsistensi. Respons FOIA yang meredaksi nama di satu dokumen tetapi melewatkannya di dokumen lain menciptakan eksposur hukum. Konfigurasi otomatis yang tetap menghilangkan inkonsistensi itu.

Materi SBU. Banyak dokumen pemerintah bersifat sensitif tetapi tidak diklasifikasikan. Pemrosesan lokal menangani file SBU tanpa penggunaan jaringan. Pemrosesan berbasis web dengan perjanjian DPA yang tepat mencakup file non-SBU.

Format output. Metode Redact menggunakan penggantian bilah hitam. Ini cocok dengan tampilan redaksi FOIA standar dan sesuai untuk produksi pengadilan. Pendekatan token — seperti [REDACTED - Exemption 6] — menambahkan kutipan pengecualian eksplisit untuk catatan yang lebih detail.

Kesimpulan

FOIA adalah kewajiban hukum. Batas waktu 20 hari kerja bukan sekadar target. Ketika volume permintaan melebihi kapasitas staf, kegagalan pun terjadi.

Redaksi batch bertenaga AI tidak menggantikan penilaian hukum. Ia menghilangkan fase mekanis — menemukan dan menandai data pribadi standar di ribuan dokumen. Fase itu menghabiskan 70–80% waktu tinjauan. Staf kemudian bisa fokus pada 10–20% dokumen di mana konteks menjadi penting.

ARPA-H dan HHS/CMS sama-sama melihat hal ini. Pemerintah negara bagian dan lokal serta organisasi EU yang menghadapi kewajiban DSAR menghadapi tantangan yang sama. Lihat ikhtisar keamanan dan kepatuhan kami untuk cara alur kerja redaksi yang dapat dipertahankan disusun.

Sumber

Siap untuk melindungi data Anda?

Mulai anonimisasi PII dengan 285+ jenis entitas dalam 48 bahasa.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.