By · Last updated 2026-05-28

بازگشت به وبلاگفنی

FOIA: هوش مصنوعی تحریر را از هفته‌ها به ساعت‌ها کاهش می‌دهد

دولت فدرال آمریکا در سال ۲۰۲۴ حدود ۵۰۰ میلیون دلار برای پردازش FOIA هزینه کرد، عمدتاً برای تحریر دستی. ARPA-H صراحتاً نرم‌افزار تحریر هوش مصنوعی خریداری کرد تا این بار را کاهش دهد.

May 28, 20268 دقیقه مطالعه
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: هوش مصنوعی تحریر را از هفته‌ها به ساعت‌ها کاهش می‌دهد

به‌روزرسانی برای ۲۰۲۶.

دولت فدرال آمریکا در سال ۲۰۲۴ حدود ۵۰۰ میلیون دلار برای پردازش FOIA هزینه کرد. بیشتر این هزینه برای تحریر دستی بود. عقب‌ماندگی DOJ از ۱۰۰٬۰۰۰ درخواست باز گذشت.

ARPA-H در سال ۲۰۲۵ یک خرید برای نرم‌افزار تحریر هوش مصنوعی انجام داد. HHS دریافت که بخش CMS آن به ابزارهای مبتنی بر هوش مصنوعی نیاز دارد. کار دستی عقب‌ماندگی‌هایی ایجاد کرده بود که کارکنان نمی‌توانستند آنها را پاک کنند.

سؤال تغییر کرده است. دیگر این نیست که آیا باید خودکارسازی کرد. بلکه این است که چطور این کار را به شکلی انجام داد که در دادگاه قابل دفاع باشد.

مشکل عقب‌ماندگی فدرال

طبق ۵ U.S.C. §552، آژانس‌ها باید ظرف ۲۰ روز کاری پاسخ دهند. در عمل، بسیاری ماه‌ها طول می‌کشند. برخی سال‌ها.

عقب‌ماندگی ۱۰۰٬۰۰۰+ درخواست DOJ معادل تقریباً ۲ میلیارد دقیقه بررسی دستی است. این فرض می‌کند فقط ۲۰ دقیقه در هر درخواست. با نرخ‌های صورت‌حساب دولتی، هزینه نیروی کار به میلیاردها می‌رسد.

بیشتر آن زمان برای یک وظیفه صرف می‌شود. کارکنان صفحات را برای نام‌ها، آدرس‌ها و شماره تلفن‌ها اسکن می‌کنند. این نیازی به قضاوت وکیل ندارد. به تطابق الگو نیاز دارد. یک الگوریتم آن را در ثانیه‌ها انجام می‌دهد.

آنچه ARPA-H و HHS نیاز داشتند

ARPA-H نرم‌افزار تحریر هوش مصنوعی برای پردازش اسناد FOIA درخواست کرد. الزامات اعلام‌شده آنها عبارت بودند از:

  • شناسایی خودکار داده‌های شخصی معافیت ۶ و ۷(C)
  • پردازش دسته‌ای مجموعه‌های بزرگ اسناد
  • پشتیبانی از فرمت مختلط: PDF، Word و ایمیل
  • مستندات ردیابی حسابرسی
  • خروجی قابل دفاع برای پاسخ FOIA

HHS/CMS به همین نتیجه رسید. حجم‌های فزاینده و کارکنان ثابت بررسی دستی را غیرقابل تحمل کرد. این آژانس‌ها به دنبال فناوری جدید نبودند. آنها یک بحران انطباق را حل می‌کردند.

ایالتی و محلی: منابع کمتر، قوانین یکسان

آژانس‌های فدرال دفاتر FOIA اختصاصی و بودجه‌های حقوقی دارند. دولت‌های ایالتی و محلی با همان وظایف قانونی و منابع بسیار کمتر روبرو هستند.

CPRA کالیفرنیا پاسخ را در ۱۰ روز تقویمی الزامی می‌کند. یک شهرستان با تیم حقوقی سه‌نفره نمی‌تواند ۲٬۰۰۰ سند را در آن بازه زمانی بررسی کند. گزینه‌ها محدود هستند:

  1. رد یا تأخیر — که ریسک حقوقی ایجاد می‌کند
  2. استخدام کارمندان موقت — گران و کند
  3. خودکارسازی مرحله تحریر مکانیکی

گزینه ۳ اکنون در دسترس است. همان پردازش دسته‌ای که آژانس‌های فدرال استفاده می‌کنند برای دپارتمان‌های حقوقی شهرستان نیز در دسترس است. به جداول زمانی خرید طولانی نیازی نیست. برای اینکه ببینید قوانین سوابق عمومی در حوزه‌های قضایی مختلف چگونه اعمال می‌شوند، نمای کلی انطباق ما را ببینید.

DSARهای اتحادیه اروپا: همان مشکل

درخواست‌های دسترسی موضوع داده (DSAR) ماده ۱۵ GDPR چالش موازی برای سازمان‌های اروپایی ایجاد می‌کند. برخلاف FOIA، تعهدات DSAR برای همه سازمان‌هایی که با داده‌های شخصی سروکار دارند اعمال می‌شود.

چالش عملی مانند FOIA است. یک سازمان باید تمام داده‌های نگهداری‌شده درباره یک شخص خاص را تولید کند. داده‌های شخصی شخص ثالث باید از پاسخ تحریر شوند. مهلت ۳۰ روز است.

هر DSAR که بایگانی ایمیل، تیکت‌های پشتیبانی و سوابق سفارش را لمس می‌کند، می‌تواند به معنای صدها سند برای بررسی باشد. برای سازمان‌هایی که ۲۰ تا ۵۰ DSAR در ماه دریافت می‌کنند، بررسی دستی به یک یا چند کارمند تمام‌وقت نیاز دارد. اتوماسیون دسته‌ای آن را به کار نیمه‌وقت کاهش می‌دهد.

پردازش دسکتاپ برای سوابق حساس

برخی آژانس‌ها نمی‌توانند از ابزارهای مبتنی بر وب استفاده کنند. داده‌هایی که باید در سیستم‌های آژانس بمانند به پردازش محلی نیاز دارند.

اپلیکیشن دسکتاپ (anonym.plus) برای این مورد استفاده ساخته شده است:

  • تمام پردازش روی سخت‌افزار خود آژانس اجرا می‌شود
  • هیچ داده‌ای به سرورهای خارجی ارسال نمی‌شود
  • اجراهای دسته‌ای ۱ تا ۵٬۰۰۰ فایل را در یک بار مدیریت می‌کنند
  • فرمت‌های پشتیبانی‌شده: PDF، DOCX، XLSX، TXT، CSV، JSON، XML
  • فایل‌های پردازش‌شده به عنوان آرشیو ZIP بسته‌بندی می‌شوند
  • صادرات CSV و JSON با متادیتای هر فایل موجود است

برای آژانس‌هایی با شبکه‌های هوایی یا قوانین سکونتگاه داده سخت‌گیرانه، پردازش محلی تنها مسیر قابل اجرا است. اپلیکیشن دسکتاپ از همان مدل تشخیص استفاده می‌کند — XLM-RoBERTa با ۲۸۵+ نوع موجودیت — مانند پلتفرم وب. کاملاً آفلاین کار می‌کند.

مستندات اپلیکیشن دسکتاپ ما را برای جزئیات راه‌اندازی ببینید.

نکات پیاده‌سازی

رد حسابرسی. جریان‌های کاری دولتی نیاز به سوابق آنچه تحریر شد، بر چه اساسی، و توسط چه کسی دارند. متادیتای دسته‌ای دو مورد اول را پوشش می‌دهد. مسیریابی اسناد استثنا از طریق بررسی کارکنان بقیه را پوشش می‌دهد.

ثبات. پاسخ FOIA که نامی را در یک سند تحریر می‌کند اما در سند دیگری از دست می‌دهد، مواجهه قانونی ایجاد می‌کند. یک پیکربندی خودکار ثابت آن ناسازگاری را حذف می‌کند.

مواد SBU. بسیاری از اسناد دولتی حساس اما طبقه‌بندی‌نشده هستند. پردازش محلی فایل‌های SBU را بدون استفاده از شبکه مدیریت می‌کند.

فرمت خروجی. روش Redact از جایگزینی نوار سیاه استفاده می‌کند. این با شکل تحریرهای استاندارد FOIA مطابقت دارد و برای تولید دادگاه مناسب است.

خط پایین

FOIA یک وظیفه قانونی است. مهلت ۲۰ روز کاری یک هدف نیست. وقتی حجم درخواست‌ها از آنچه کارکنان می‌توانند مدیریت کنند تجاوز می‌کند، شکست‌ها پیروی می‌کنند.

تحریر دسته‌ای مبتنی بر هوش مصنوعی قضاوت حقوقی را جایگزین نمی‌کند. مرحله مکانیکی را حذف می‌کند — پیدا کردن و علامت‌گذاری داده‌های شخصی استاندارد در هزاران سند. آن مرحله ۷۰ تا ۸۰ درصد زمان بررسی را مصرف می‌کند. کارکنان می‌توانند سپس روی ۱۰ تا ۲۰ درصد اسنادی که زمینه در آنها اهمیت دارد تمرکز کنند.

ARPA-H و HHS/CMS هر دو این را دیدند. دولت‌های ایالتی و محلی و سازمان‌های اروپایی با وظایف DSAR با همان چالش روبرو هستند. برای اینکه ببینید جریان‌های کاری تحریر قابل دفاع چگونه ساختار می‌یابند، نمای کلی امنیت و انطباق ما را ببینید.

منابع

آماده‌اید داده‌های خود را محافظت کنید؟

شروع به ناشناس‌سازی PII با بیش از ۲۸۵ نوع نهاد در ۴۸ زبان.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.