FOIA: AI संपादन को सप्ताहों से घंटों में घटाता है
2026 के लिए अपडेट किया गया।
संघीय सरकार ने 2024 में FOIA प्रोसेसिंग पर अनुमानित $500M खर्च किया। उस लागत का अधिकांश हिस्सा मैनुअल संपादन था। DOJ का बैकलॉग 100,000 खुले अनुरोधों से अधिक हो गया।
ARPA-H ने 2025 में AI संपादन सॉफ़्टवेयर के लिए खरीद जारी किया। HHS ने पाया कि इसके CMS डिवीजन को AI-संचालित उपकरणों की जरूरत है। मैनुअल काम ने ऐसे बैकलॉग बनाए थे जिन्हें कर्मचारी साफ नहीं कर सकते थे।
सवाल बदल गया है। यह अब स्वचालन के बारे में नहीं है या नहीं। यह इसे इस तरह से करने के बारे में है जो अदालत में टिके।
संघीय बैकलॉग समस्या
5 U.S.C. §552 के तहत, एजेंसियों को 20 व्यावसायिक दिनों के भीतर जवाब देना होगा। व्यवहार में, कई महीने लेती हैं। कुछ साल लेती हैं।
100,000+ अनुरोधों का DOJ बैकलॉग मैनुअल समीक्षा के लगभग 2 बिलियन मिनट के बराबर है। यह प्रति अनुरोध केवल 20 मिनट मानता है। सरकारी बिलिंग दरों पर, श्रम लागत अरबों में चली जाती है।
उस समय का अधिकांश हिस्सा एक कार्य पर जाता है। कर्मचारी नाम, पते और फोन नंबरों के लिए पृष्ठ स्कैन करते हैं। इसके लिए वकील के निर्णय की जरूरत नहीं है। इसके लिए पैटर्न मिलान चाहिए। एक एल्गोरिथम इसे सेकंडों में करता है।
ARPA-H और HHS ने क्या मांगा
ARPA-H ने FOIA दस्तावेज़ प्रोसेसिंग के लिए AI संपादन सॉफ़्टवेयर मांगा। उनकी बताई गई आवश्यकताएं थीं:
- Exemption 6 और 7(C) व्यक्तिगत डेटा की स्वतः पहचान।
- बड़े दस्तावेज़ सेट की बैच प्रोसेसिंग।
- मिश्रित प्रारूप समर्थन: PDF, Word, और ईमेल।
- ऑडिट ट्रेल दस्तावेज़ीकरण।
- FOIA प्रतिक्रिया के लिए प्रमाणसम्मत आउटपुट।
HHS/CMS उसी निष्कर्ष पर पहुंचा। बढ़ती मात्रा और फ्लैट स्टाफिंग ने मैनुअल समीक्षा को अस्थिर बना दिया। ये एजेंसियां नई तकनीक का पीछा नहीं कर रही थीं। वे एक अनुपालन संकट हल कर रही थीं।
राज्य और स्थानीय: कम संसाधन, समान नियम
संघीय एजेंसियों के पास समर्पित FOIA कार्यालय और कानूनी बजट हैं। राज्य और स्थानीय सरकारों को बहुत कम संसाधनों के साथ समान कानूनी कर्तव्यों का सामना करना पड़ता है।
California का CPRA 10 कैलेंडर दिनों के भीतर जवाब मांगता है। तीन व्यक्तियों की कानूनी टीम वाला काउंटी उस विंडो में 2,000 दस्तावेज़ों के माध्यम से काम नहीं कर सकता। विकल्प सीमित हैं:
- इनकार या देरी करें — जो कानूनी जोखिम पैदा करता है।
- अस्थायी कर्मचारी नियुक्त करें — महंगा और धीमा।
- मैकेनिकल संपादन चरण को स्वचालित करें।
विकल्प 3 अब पहुंच के भीतर है। संघीय एजेंसियां जो बैच प्रोसेसिंग उपयोग करती हैं वह काउंटी कानूनी विभागों के लिए उपलब्ध है। कोई लंबी खरीद समयसीमा नहीं। सार्वजनिक रिकॉर्ड नियम कैसे लागू होते हैं, इसके लिए हमारा compliance overview देखें।
EU DSAR: वही समस्या
GDPR अनुच्छेद 15 डेटा विषय एक्सेस अनुरोध (DSAR) EU संगठनों के लिए एक समानांतर चुनौती पैदा करते हैं। FOIA के विपरीत, DSAR दायित्व उन सभी संगठनों पर लागू होते हैं जो व्यक्तिगत डेटा संभालते हैं। एक छोटी SaaS फर्म को एक बड़े बैंक जितने DSAR प्राप्त हो सकते हैं।
व्यावहारिक चुनौती FOIA को दर्शाती है। एक संगठन को किसी विशिष्ट व्यक्ति के बारे में रखे गए सभी डेटा का उत्पादन करना होगा। तृतीय-पक्ष व्यक्तिगत डेटा को प्रतिक्रिया से संपादित किया जाना चाहिए। समयसीमा 30 दिन है।
ईमेल अभिलेखागार, सहायता टिकट और ऑर्डर रिकॉर्ड को छूने वाला प्रत्येक DSAR जांचने के लिए सैकड़ों दस्तावेज़ों का मतलब हो सकता है। महीने में 20-50 DSAR संभालने वाले संगठनों के लिए, मैनुअल समीक्षा में एक या अधिक पूर्णकालिक कर्मचारी की जरूरत होती है। बैच स्वचालन इसे अंशकालिक काम तक घटा देता है।
संवेदनशील रिकॉर्ड के लिए डेस्कटॉप प्रोसेसिंग
कुछ एजेंसियां वेब-आधारित उपकरण नहीं उपयोग कर सकतीं। डेटा जिसे एजेंसी सिस्टम के भीतर रहना चाहिए उसे स्थानीय प्रोसेसिंग की जरूरत है।
Desktop App (anonym.plus) इस उपयोग के मामले के लिए बनाया गया है:
- सभी प्रोसेसिंग एजेंसी के अपने हार्डवेयर पर चलती है।
- बाहरी सर्वर को कोई डेटा नहीं भेजा जाता।
- बैच रन एक बार में 1-5,000 फ़ाइलें संभालते हैं।
- समर्थित प्रारूप: PDF, DOCX, XLSX, TXT, CSV, JSON, XML।
- प्रोसेस की गई फ़ाइलें ZIP संग्रह के रूप में पैकेज की जाती हैं।
- CSV और JSON प्रति-फ़ाइल मेटाडेटा के साथ एक्सपोर्ट शामिल हैं।
एयर-गैप्ड नेटवर्क या सख्त डेटा निवास नियमों वाली एजेंसियों के लिए, स्थानीय प्रोसेसिंग एकमात्र व्यावहारिक मार्ग है। Desktop App वही डिटेक्शन मॉडल — 285+ entity प्रकारों के साथ XLM-RoBERTa — उपयोग करता है जैसा वेब प्लेटफ़ॉर्म करता है। यह पूरी तरह से ऑफलाइन काम करता है।
सेटअप विवरण के लिए हमारा Desktop App documentation देखें।
कार्यान्वयन नोट
ऑडिट ट्रेल। सरकारी वर्कफ्लो को रिकॉर्ड की आवश्यकता होती है कि क्या संपादित किया गया, किस आधार पर, और किसने किया। बैच मेटाडेटा पहले दो को कवर करता है। अपवाद दस्तावेज़ों को कर्मचारी समीक्षा के माध्यम से रूट करना बाकी को कवर करता है।
संगति। एक FOIA प्रतिक्रिया जो एक दस्तावेज़ में एक नाम संपादित करती है लेकिन दूसरे में उसे छोड़ती है, कानूनी जोखिम पैदा करती है। एक निश्चित स्वचालित कॉन्फिगरेशन उस असंगति को हटाता है।
SBU सामग्री। कई सरकारी दस्तावेज़ संवेदनशील लेकिन अवर्गीकृत हैं। स्थानीय प्रोसेसिंग बिना नेटवर्क उपयोग के SBU फ़ाइलों को संभालती है। उचित DPA समझौतों के साथ वेब-आधारित प्रोसेसिंग गैर-SBU फ़ाइलों को कवर करती है।
आउटपुट प्रारूप। Redact विधि काले बार प्रतिस्थापन का उपयोग करती है। यह मानक FOIA संपादन के रूप से मेल खाती है और अदालती उत्पादन के लिए उपयुक्त है। टोकन दृष्टिकोण — जैसे [REDACTED - Exemption 6] — अधिक विस्तृत रिकॉर्ड के लिए स्पष्ट छूट उद्धरण जोड़ता है।
निष्कर्ष
FOIA एक कानूनी कर्तव्य है। 20-व्यावसायिक-दिन की समयसीमा एक लक्ष्य नहीं है। जब अनुरोध की मात्रा कर्मचारियों के संभाल सकने से अधिक हो जाती है, तो विफलताएं होती हैं।
AI-संचालित बैच संपादन कानूनी निर्णय की जगह नहीं लेता। यह मैकेनिकल चरण हटाता है — हजारों दस्तावेज़ों में मानक व्यक्तिगत डेटा खोजना और चिह्नित करना। वह चरण 70-80% समीक्षा समय उपभोग करता है। कर्मचारी तब 10-20% दस्तावेज़ों पर ध्यान केंद्रित कर सकते हैं जहाँ संदर्भ मायने रखता है।
ARPA-H और HHS/CMS दोनों ने यह देखा। DSAR कर्तव्यों का सामना करने वाले राज्य और स्थानीय सरकारें और EU संगठन समान चुनौती का सामना करते हैं। प्रमाणसम्मत संपादन वर्कफ्लो कैसे संरचित हैं, इसके लिए हमारा security and compliance overview देखें।