FOIA: AI রিডেকশন সপ্তাহ থেকে ঘণ্টায় নামিয়ে আনে
2026 সালের জন্য আপডেট করা হয়েছে।
ফেডারেল সরকার 2024 সালে FOIA প্রক্রিয়াকরণে আনুমানিক $500M ব্যয় করেছে। সেই খরচের বেশিরভাগই ছিল ম্যানুয়াল রিডেকশন। DOJ ব্যাকলগ 100,000 খোলা অনুরোধ অতিক্রম করেছে।
ARPA-H 2025 সালে AI রিডেকশন সফটওয়্যারের জন্য একটি প্রকিউরমেন্ট জারি করেছে। HHS দেখেছে যে তার CMS বিভাগের AI-চালিত সরঞ্জাম দরকার। ম্যানুয়াল কাজ এমন ব্যাকলগ তৈরি করেছিল যা কর্মীরা পরিষ্কার করতে পারছিল না।
প্রশ্নটি বদলে গেছে। এখন আর স্বয়ংক্রিয় করা উচিত কিনা তা নিয়ে নয়। এটি নিয়ে যে আদালতে টিকবে এমনভাবে কীভাবে করা যায়।
ফেডারেল ব্যাকলগ সমস্যা
5 U.S.C. §552 এর অধীনে, সংস্থাগুলিকে 20 কার্যদিবসের মধ্যে সাড়া দিতে হবে। বাস্তবে, অনেকেই মাস লাগায়। কেউ কেউ বছর।
100,000+ অনুরোধের DOJ ব্যাকলগ প্রায় 2 বিলিয়ন মিনিটের ম্যানুয়াল পর্যালোচনার সমান। প্রতি অনুরোধে মাত্র 20 মিনিট ধরে। সরকারি বিলিং হারে, শ্রম খরচ বিলিয়নে পৌঁছায়।
বেশিরভাগ সময় একটি কাজেই যায়। কর্মীরা নাম, ঠিকানা এবং ফোন নম্বরের জন্য পৃষ্ঠা স্ক্যান করে। সেটার জন্য আইনজীবীর বিচার দরকার নেই। প্যাটার্ন ম্যাচিং দরকার। একটি অ্যালগরিদম সেকেন্ডে করে।
ARPA-H এবং HHS এর প্রয়োজনীয়তা
ARPA-H FOIA ডকুমেন্ট প্রক্রিয়াকরণের জন্য AI রিডেকশন সফটওয়্যার চেয়েছিল। তাদের উল্লেখিত প্রয়োজনীয়তা ছিল:
- Exemption 6 এবং 7(C) ব্যক্তিগত ডেটার স্বয়ংক্রিয় সনাক্তকরণ।
- বড় ডকুমেন্ট সেটের ব্যাচ প্রক্রিয়াকরণ।
- মিশ্র ফরম্যাট সমর্থন: PDF, Word, এবং ইমেইল।
- অডিট ট্রেইল ডকুমেন্টেশন।
- FOIA প্রতিক্রিয়ার জন্য প্রতিরক্ষাযোগ্য আউটপুট।
HHS/CMS একই উপসংহারে পৌঁছেছে। ক্রমবর্ধমান ভলিউম এবং স্থির কর্মী সংখ্যা ম্যানুয়াল পর্যালোচনাকে অসম্ভব করে তুলেছে।
রাজ্য এবং স্থানীয়: কম সম্পদ, একই নিয়ম
ফেডারেল সংস্থাগুলির ডেডিকেটেড FOIA অফিস এবং আইনি বাজেট আছে। রাজ্য এবং স্থানীয় সরকারগুলি অনেক কম সম্পদ নিয়ে একই আইনি দায়িত্ব পালন করে।
ক্যালিফোর্নিয়ার CPRA 10 ক্যালেন্ডার দিনের মধ্যে প্রতিক্রিয়া প্রয়োজন। তিন-ব্যক্তির আইনি টিম সহ একটি কাউন্টি সেই সময়সীমায় 2,000 ডকুমেন্ট প্রক্রিয়া করতে পারে না। বিকল্পগুলি সীমিত:
- প্রত্যাখ্যান বা বিলম্ব — যা আইনি ঝুঁকি তৈরি করে।
- অস্থায়ী কর্মী নিয়োগ — ব্যয়বহুল এবং ধীর।
- যান্ত্রিক রিডেকশন পর্যায়টি স্বয়ংক্রিয় করুন।
বিকল্প 3 এখন নাগালের মধ্যে। আমাদের সম্মতি ওভারভিউ দেখুন।
EU DSARs: একই সমস্যা
GDPR আর্টিকেল 15 Data Subject Access Requests (DSARs) EU সংস্থাগুলির জন্য একটি সমান্তরাল চ্যালেঞ্জ তৈরি করে। FOIA এর বিপরীতে, DSAR বাধ্যবাধকতা ব্যক্তিগত ডেটা পরিচালনা করে এমন সমস্ত সংস্থার ক্ষেত্রে প্রযোজ্য।
ব্যবহারিক চ্যালেঞ্জ FOIA-এর মতো। একটি সংস্থাকে একটি নির্দিষ্ট ব্যক্তি সম্পর্কে সমস্ত ডেটা তৈরি করতে হবে। তৃতীয়-পক্ষের ব্যক্তিগত ডেটা প্রতিক্রিয়া থেকে রিডেক্ট করতে হবে। সময়সীমা 30 দিন।
প্রতি মাসে 20-50 DSAR পরিচালনা করা সংস্থাগুলির জন্য, ম্যানুয়াল পর্যালোচনায় এক বা একাধিক পূর্ণকালীন কর্মী প্রয়োজন। ব্যাচ অটোমেশন এটিকে খণ্ডকালীন কাজে পরিণত করে।
সংবেদনশীল রেকর্ডের জন্য ডেস্কটপ প্রক্রিয়াকরণ
কিছু সংস্থা ওয়েব-ভিত্তিক সরঞ্জাম ব্যবহার করতে পারে না। সংস্থা সিস্টেমের মধ্যে থাকতে হবে এমন ডেটার স্থানীয় প্রক্রিয়াকরণ দরকার।
Desktop App (anonym.plus) এই ব্যবহারের ক্ষেত্রের জন্য তৈরি:
- সমস্ত প্রক্রিয়াকরণ সংস্থার নিজস্ব হার্ডওয়্যারে চলে।
- কোনো ডেটা বাইরের সার্ভারে পাঠানো হয় না।
- ব্যাচ রান একবারে 1-5,000 ফাইল পরিচালনা করে।
- সমর্থিত ফরম্যাট: PDF, DOCX, XLSX, TXT, CSV, JSON, XML।
- প্রক্রিয়াকৃত ফাইল ZIP আর্কাইভ হিসেবে প্যাকেজ করা হয়।
এয়ার-গ্যাপড নেটওয়ার্ক বা কঠোর ডেটা রেসিডেন্সি নিয়মযুক্ত সংস্থাগুলির জন্য, স্থানীয় প্রক্রিয়াকরণ একমাত্র কার্যকর পথ। Desktop App 285+ সত্তার ধরনযুক্ত একই XLM-RoBERTa ডিটেকশন মডেল ব্যবহার করে এবং সম্পূর্ণ অফলাইনে কাজ করে।
বাস্তবায়ন নোট
অডিট ট্রেইল। সরকারি ওয়ার্কফ্লোতে রেকর্ড প্রয়োজন যে কী রিডেক্ট করা হয়েছে, কোন ভিত্তিতে, এবং কার দ্বারা।
সামঞ্জস্য। একটি FOIA প্রতিক্রিয়া যা এক ডকুমেন্টে একটি নাম রিডেক্ট করে কিন্তু অন্যটিতে মিস করে আইনি ঝুঁকি তৈরি করে।
SBU উপকরণ। অনেক সরকারি ডকুমেন্ট sensitive but unclassified। স্থানীয় প্রক্রিয়াকরণ কোনো নেটওয়ার্ক ব্যবহার ছাড়াই SBU ফাইল পরিচালনা করে।
আউটপুট ফরম্যাট। Redact পদ্ধতি কালো বার প্রতিস্থাপন ব্যবহার করে। এটি আদালত উৎপাদনের জন্য উপযুক্ত।
মূল কথা
FOIA একটি আইনি দায়িত্ব। 20-কার্যদিবসের সময়সীমা একটি লক্ষ্য নয়। যখন অনুরোধের পরিমাণ কর্মীরা পরিচালনা করতে পারে তার বেশি হয়, তখন ব্যর্থতা ঘটে।
AI-চালিত ব্যাচ রিডেকশন আইনি বিচার প্রতিস্থাপন করে না। এটি যান্ত্রিক পর্যায় দূর করে — হাজার হাজার ডকুমেন্ট জুড়ে মানক ব্যক্তিগত ডেটা খোঁজা এবং চিহ্নিত করা। সেই পর্যায় 70-80% পর্যালোচনা সময় নেয়।