FOIA: هوش مصنوعی تحریر را از هفتهها به ساعتها کاهش میدهد
بهروزرسانی برای ۲۰۲۶.
دولت فدرال آمریکا در سال ۲۰۲۴ حدود ۵۰۰ میلیون دلار برای پردازش FOIA هزینه کرد. بیشتر این هزینه برای تحریر دستی بود. عقبماندگی DOJ از ۱۰۰٬۰۰۰ درخواست باز گذشت.
ARPA-H در سال ۲۰۲۵ یک خرید برای نرمافزار تحریر هوش مصنوعی انجام داد. HHS دریافت که بخش CMS آن به ابزارهای مبتنی بر هوش مصنوعی نیاز دارد. کار دستی عقبماندگیهایی ایجاد کرده بود که کارکنان نمیتوانستند آنها را پاک کنند.
سؤال تغییر کرده است. دیگر این نیست که آیا باید خودکارسازی کرد. بلکه این است که چطور این کار را به شکلی انجام داد که در دادگاه قابل دفاع باشد.
مشکل عقبماندگی فدرال
طبق ۵ U.S.C. §552، آژانسها باید ظرف ۲۰ روز کاری پاسخ دهند. در عمل، بسیاری ماهها طول میکشند. برخی سالها.
عقبماندگی ۱۰۰٬۰۰۰+ درخواست DOJ معادل تقریباً ۲ میلیارد دقیقه بررسی دستی است. این فرض میکند فقط ۲۰ دقیقه در هر درخواست. با نرخهای صورتحساب دولتی، هزینه نیروی کار به میلیاردها میرسد.
بیشتر آن زمان برای یک وظیفه صرف میشود. کارکنان صفحات را برای نامها، آدرسها و شماره تلفنها اسکن میکنند. این نیازی به قضاوت وکیل ندارد. به تطابق الگو نیاز دارد. یک الگوریتم آن را در ثانیهها انجام میدهد.
آنچه ARPA-H و HHS نیاز داشتند
ARPA-H نرمافزار تحریر هوش مصنوعی برای پردازش اسناد FOIA درخواست کرد. الزامات اعلامشده آنها عبارت بودند از:
- شناسایی خودکار دادههای شخصی معافیت ۶ و ۷(C)
- پردازش دستهای مجموعههای بزرگ اسناد
- پشتیبانی از فرمت مختلط: PDF، Word و ایمیل
- مستندات ردیابی حسابرسی
- خروجی قابل دفاع برای پاسخ FOIA
HHS/CMS به همین نتیجه رسید. حجمهای فزاینده و کارکنان ثابت بررسی دستی را غیرقابل تحمل کرد. این آژانسها به دنبال فناوری جدید نبودند. آنها یک بحران انطباق را حل میکردند.
ایالتی و محلی: منابع کمتر، قوانین یکسان
آژانسهای فدرال دفاتر FOIA اختصاصی و بودجههای حقوقی دارند. دولتهای ایالتی و محلی با همان وظایف قانونی و منابع بسیار کمتر روبرو هستند.
CPRA کالیفرنیا پاسخ را در ۱۰ روز تقویمی الزامی میکند. یک شهرستان با تیم حقوقی سهنفره نمیتواند ۲٬۰۰۰ سند را در آن بازه زمانی بررسی کند. گزینهها محدود هستند:
- رد یا تأخیر — که ریسک حقوقی ایجاد میکند
- استخدام کارمندان موقت — گران و کند
- خودکارسازی مرحله تحریر مکانیکی
گزینه ۳ اکنون در دسترس است. همان پردازش دستهای که آژانسهای فدرال استفاده میکنند برای دپارتمانهای حقوقی شهرستان نیز در دسترس است. به جداول زمانی خرید طولانی نیازی نیست. برای اینکه ببینید قوانین سوابق عمومی در حوزههای قضایی مختلف چگونه اعمال میشوند، نمای کلی انطباق ما را ببینید.
DSARهای اتحادیه اروپا: همان مشکل
درخواستهای دسترسی موضوع داده (DSAR) ماده ۱۵ GDPR چالش موازی برای سازمانهای اروپایی ایجاد میکند. برخلاف FOIA، تعهدات DSAR برای همه سازمانهایی که با دادههای شخصی سروکار دارند اعمال میشود.
چالش عملی مانند FOIA است. یک سازمان باید تمام دادههای نگهداریشده درباره یک شخص خاص را تولید کند. دادههای شخصی شخص ثالث باید از پاسخ تحریر شوند. مهلت ۳۰ روز است.
هر DSAR که بایگانی ایمیل، تیکتهای پشتیبانی و سوابق سفارش را لمس میکند، میتواند به معنای صدها سند برای بررسی باشد. برای سازمانهایی که ۲۰ تا ۵۰ DSAR در ماه دریافت میکنند، بررسی دستی به یک یا چند کارمند تماموقت نیاز دارد. اتوماسیون دستهای آن را به کار نیمهوقت کاهش میدهد.
پردازش دسکتاپ برای سوابق حساس
برخی آژانسها نمیتوانند از ابزارهای مبتنی بر وب استفاده کنند. دادههایی که باید در سیستمهای آژانس بمانند به پردازش محلی نیاز دارند.
اپلیکیشن دسکتاپ (anonym.plus) برای این مورد استفاده ساخته شده است:
- تمام پردازش روی سختافزار خود آژانس اجرا میشود
- هیچ دادهای به سرورهای خارجی ارسال نمیشود
- اجراهای دستهای ۱ تا ۵٬۰۰۰ فایل را در یک بار مدیریت میکنند
- فرمتهای پشتیبانیشده: PDF، DOCX، XLSX، TXT، CSV، JSON، XML
- فایلهای پردازششده به عنوان آرشیو ZIP بستهبندی میشوند
- صادرات CSV و JSON با متادیتای هر فایل موجود است
برای آژانسهایی با شبکههای هوایی یا قوانین سکونتگاه داده سختگیرانه، پردازش محلی تنها مسیر قابل اجرا است. اپلیکیشن دسکتاپ از همان مدل تشخیص استفاده میکند — XLM-RoBERTa با ۲۸۵+ نوع موجودیت — مانند پلتفرم وب. کاملاً آفلاین کار میکند.
مستندات اپلیکیشن دسکتاپ ما را برای جزئیات راهاندازی ببینید.
نکات پیادهسازی
رد حسابرسی. جریانهای کاری دولتی نیاز به سوابق آنچه تحریر شد، بر چه اساسی، و توسط چه کسی دارند. متادیتای دستهای دو مورد اول را پوشش میدهد. مسیریابی اسناد استثنا از طریق بررسی کارکنان بقیه را پوشش میدهد.
ثبات. پاسخ FOIA که نامی را در یک سند تحریر میکند اما در سند دیگری از دست میدهد، مواجهه قانونی ایجاد میکند. یک پیکربندی خودکار ثابت آن ناسازگاری را حذف میکند.
مواد SBU. بسیاری از اسناد دولتی حساس اما طبقهبندینشده هستند. پردازش محلی فایلهای SBU را بدون استفاده از شبکه مدیریت میکند.
فرمت خروجی. روش Redact از جایگزینی نوار سیاه استفاده میکند. این با شکل تحریرهای استاندارد FOIA مطابقت دارد و برای تولید دادگاه مناسب است.
خط پایین
FOIA یک وظیفه قانونی است. مهلت ۲۰ روز کاری یک هدف نیست. وقتی حجم درخواستها از آنچه کارکنان میتوانند مدیریت کنند تجاوز میکند، شکستها پیروی میکنند.
تحریر دستهای مبتنی بر هوش مصنوعی قضاوت حقوقی را جایگزین نمیکند. مرحله مکانیکی را حذف میکند — پیدا کردن و علامتگذاری دادههای شخصی استاندارد در هزاران سند. آن مرحله ۷۰ تا ۸۰ درصد زمان بررسی را مصرف میکند. کارکنان میتوانند سپس روی ۱۰ تا ۲۰ درصد اسنادی که زمینه در آنها اهمیت دارد تمرکز کنند.
ARPA-H و HHS/CMS هر دو این را دیدند. دولتهای ایالتی و محلی و سازمانهای اروپایی با وظایف DSAR با همان چالش روبرو هستند. برای اینکه ببینید جریانهای کاری تحریر قابل دفاع چگونه ساختار مییابند، نمای کلی امنیت و انطباق ما را ببینید.