By · Last updated 2026-05-28

بلاگ پر واپس جائیںتکنیکی

FOIA: AI سے تدوین ہفتوں سے گھنٹوں میں

وفاقی حکومت نے 2024 میں FOIA پروسیسنگ پر تقریباً 500 ملین ڈالر خرچ کیے، زیادہ تر دستی تدوین پر۔ ARPA-H نے AI redaction سافٹ ویئر کی تلاش کی۔

May 28, 20268 منٹ پڑھیں
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: AI تدوین کو ہفتوں سے گھنٹوں میں لاتا ہے

2026 کے لیے اپ ڈیٹ شدہ۔

وفاقی حکومت نے 2024 میں FOIA پروسیسنگ پر تقریباً 500 ملین ڈالر خرچ کیے۔ اس لاگت کا بیشتر حصہ دستی تدوین تھا۔ DOJ کی باقی ماندہ درخواستیں 100,000 سے تجاوز کر گئیں۔

ARPA-H نے 2025 میں AI redaction سافٹ ویئر کی خریداری کا اعلان کیا۔ HHS نے پایا کہ اس کے CMS ڈویژن کو AI سے چلنے والے ٹولز کی ضرورت ہے۔ دستی کام نے ایسے بیک لاگز بنائے جو عملہ صاف نہیں کر سکتا تھا۔

سوال بدل گیا ہے۔ اب یہ نہیں کہ آٹومیشن کرنی ہے یا نہیں۔ بلکہ یہ ہے کہ اسے اس طریقے سے کیسے کیا جائے جو عدالت میں ٹھہر سکے۔

وفاقی بیک لاگ کا مسئلہ

5 U.S.C. §552 کے تحت ایجنسیوں کو 20 کاروباری دنوں میں جواب دینا ہوتا ہے۔ عملاً بہت سی مہینے لگاتی ہیں۔ کچھ سال۔

DOJ کے 100,000+ درخواستوں کا بیک لاگ تقریباً 2 ارب منٹ کا دستی جائزہ ہے — ہر درخواست کے لیے صرف 20 منٹ مان کر۔ سرکاری اجرت پر لاگت ارب ڈالر میں ہے۔

اس وقت کا زیادہ تر حصہ ایک کام میں جاتا ہے۔ عملہ صفحات پر نام، پتے، اور فون نمبر تلاش کرتا ہے۔ اس کے لیے وکیل کی رائے نہیں چاہیے۔ نمونے کی پہچان چاہیے۔ الگورتھم یہ سیکنڈوں میں کرتا ہے۔

ARPA-H اور HHS نے کیا مانگا

ARPA-H نے FOIA دستاویز پروسیسنگ کے لیے AI redaction سافٹ ویئر مانگا۔ ان کی ضروریات:

  • Exemption 6 اور 7(C) ذاتی ڈیٹا کی خودکار شناخت
  • بڑے دستاویزی سیٹوں کی batch processing
  • مخلوط فارمیٹ سپورٹ: PDF، Word، اور ای میل
  • آڈٹ ٹریل دستاویز سازی
  • FOIA جواب کے لیے قابلِ دفاع آؤٹ پٹ

HHS/CMS اسی نتیجے پر پہنچی۔ بڑھتے حجم اور مستحکم عملے نے دستی جائزہ ناقابلِ عمل بنا دیا تھا۔ یہ ایجنسیاں نئی ٹیکنالوجی کا پیچھا نہیں کر رہی تھیں — وہ تعمیل کا بحران حل کر رہی تھیں۔

ریاستی اور مقامی: کم وسائل، وہی اصول

وفاقی ایجنسیوں کے پاس سرشار FOIA دفاتر اور قانونی بجٹ ہیں۔ ریاستی اور مقامی حکومتیں بہت کم وسائل کے ساتھ وہی قانونی فرائض نبھاتی ہیں۔

کیلیفورنیا کی CPRA 10 کیلنڈر دنوں میں جواب مانگتی ہے۔ تین افراد کی قانونی ٹیم والی کاؤنٹی 2,000 دستاویزات اس وقت میں نہیں دیکھ سکتی۔ آپشن محدود ہیں:

  1. انکار یا تاخیر — جو قانونی خطرہ بناتا ہے
  2. عارضی عملہ بھرتی — مہنگا اور سست
  3. مکینیکل تدوین مرحلے کو آٹومیٹ کریں

آپشن 3 اب قابلِ رسائی ہے۔ وفاقی ایجنسیاں جو batch processing استعمال کرتی ہیں وہی کاؤنٹی قانونی محکموں کے لیے دستیاب ہے۔ طویل خریداری ٹائم لائن کی ضرورت نہیں۔ compliance overview دیکھیں کہ عوامی ریکارڈ کے قوانین دائرہ اختیار میں کیسے لاگو ہوتے ہیں۔

EU DSARs: وہی مسئلہ

GDPR آرٹیکل 15 ڈیٹا سبجیکٹ رسائی درخواستیں (DSARs) EU تنظیموں کے لیے ملتا جلتا چیلنج بناتی ہیں۔ FOIA کے برعکس، DSAR ذمہ داریاں ہر اس تنظیم پر لاگو ہوتی ہیں جو ذاتی ڈیٹا رکھتی ہے۔ ایک چھوٹی SaaS فرم وہی DSARs وصول کر سکتی ہے جتنی ایک بڑا بینک۔

عملی چیلنج FOIA جیسا ہے۔ تنظیم کو کسی مخصوص شخص کے بارے میں رکھا گیا تمام ڈیٹا فراہم کرنا ہوتا ہے۔ فریقِ ثالث کا ذاتی ڈیٹا جواب سے تدوین ہونا چاہیے۔ آخری تاریخ 30 دن ہے۔

ہر DSAR جو ای میل آرکائیوز، سپورٹ ٹکٹس، اور آرڈر ریکارڈز کو چھوتی ہے سیکڑوں دستاویزات کی جانچ کا مطلب ہو سکتی ہے۔ ماہانہ 20-50 DSARs سنبھالنے والی تنظیموں کے لیے دستی جائزہ ایک یا زیادہ کل وقتی عملے کی ضرورت ہے۔ Batch automation اسے جز وقتی کام میں بدل دیتی ہے۔

حساس ریکارڈز کی Desktop Processing

کچھ ایجنسیاں web-based ٹولز استعمال نہیں کر سکتیں۔ ایجنسی سسٹمز میں رہنے والے ڈیٹا کو مقامی پروسیسنگ چاہیے۔

Desktop App (anonym.plus) اس استعمال کے لیے بنا ہے:

  • تمام پروسیسنگ ایجنسی کے اپنے hardware پر چلتی ہے
  • کوئی ڈیٹا بیرونی سرورز کو نہیں جاتا
  • Batch runs ایک وقت میں 1-5,000 فائلیں سنبھالتی ہیں
  • سپورٹ شدہ فارمیٹس: PDF، DOCX، XLSX، TXT، CSV، JSON، XML
  • پروسیس شدہ فائلیں ZIP آرکائیو کے طور پر پیک ہوتی ہیں
  • CSV اور JSON export فی فائل metadata کے ساتھ شامل ہے

اگر air-gapped نیٹ ورکس یا سخت ڈیٹا residency اصول ہوں تو مقامی پروسیسنگ واحد قابلِ عمل راستہ ہے۔ Desktop App وہی detection ماڈل استعمال کرتا ہے — XLM-RoBERTa 285+ ادارے کی اقسام کے ساتھ — جیسا web پلیٹ فارم۔ یہ مکمل آف لائن کام کرتا ہے۔

سیٹ اپ کی تفصیلات کے لیے Desktop App documentation دیکھیں۔

عمل درآمد کے نوٹس

آڈٹ ٹریلز۔ حکومتی ورک فلو میں یہ ریکارڈ چاہیے کہ کیا تدوین ہوا، کس بنیاد پر، اور کس نے۔ Batch metadata پہلی دو چیزیں کور کرتی ہے۔ استثنائی دستاویزات کو عملے کے جائزے سے گزارنا باقی کا خیال رکھتا ہے۔

یکسانیت۔ ایک FOIA جواب جو ایک دستاویز میں نام تدوین کرے لیکن دوسری میں چوک جائے قانونی خطرہ بناتا ہے۔ ایک مقررہ خودکار کنفیگریشن وہ عدم یکسانیت ختم کرتی ہے۔

SBU مواد۔ بہت سی حکومتی دستاویزات حساس لیکن غیر مخفی ہوتی ہیں۔ مقامی پروسیسنگ SBU فائلوں کو بغیر نیٹ ورک استعمال کے سنبھالتی ہے۔

آؤٹ پٹ فارمیٹ۔ Redact طریقہ سیاہ بار replacement استعمال کرتا ہے۔ یہ معیاری FOIA تدوینات جیسا دکھتا ہے اور عدالتی پیداوار کے لیے موزوں ہے۔ ٹوکن نقطہ نظر — جیسے `[REDACTED - Exemption 6]` — زیادہ تفصیلی ریکارڈز کے لیے واضح استثنائی حوالہ شامل کرتا ہے۔

خلاصہ

FOIA ایک قانونی فریضہ ہے۔ 20 کاروباری دن کی آخری تاریخ ہدف نہیں ہے۔ جب درخواست کا حجم عملے کی صلاحیت سے بڑھ جاتا ہے تو ناکامی لازمی ہے۔

AI سے چلنے والی batch redaction قانونی فیصلے کی جگہ نہیں لیتی۔ یہ مکینیکل مرحلہ ہٹاتی ہے — ہزاروں دستاویزات میں معیاری ذاتی ڈیٹا تلاش کرنا اور نشان لگانا۔ وہ مرحلہ 70-80% جائزے کا وقت لیتا ہے۔ عملہ پھر ان 10-20% دستاویزات پر توجہ دے سکتا ہے جہاں سیاق و سباق اہمیت رکھتا ہے۔

ARPA-H اور HHS/CMS دونوں نے یہ دیکھا۔ DSAR ذمہ داریوں کا سامنا کرنے والی ریاستی و مقامی حکومتیں اور EU تنظیمیں ایک ہی چیلنج کا سامنا کرتی ہیں۔ قابلِ دفاع redaction ورک فلو کے بارے میں security and compliance overview دیکھیں۔

ذرائع

کیا آپ اپنے ڈیٹا کی حفاظت کے لیے تیار ہیں؟

48 زبانوں میں 285+ ادارتی اقسام کے ساتھ PII کی گمنامی شروع کریں۔

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.