ब्लॉग पर वापस जाएँतकनीकी

AI युग में FOIA: एजेंसियाँ कैसे सप्ताहों से घंटों में...

संघीय सरकार ने 2024 में FOIA प्रोसेसिंग पर अनुमानित $500M खर्च किए, जिसमें अधिकांश मैनुअल रेडैक्शन शामिल था। ARPA-H ने बढ़ती अनुरोध मात्रा को...

April 19, 20268 मिनट पढ़ें
FOIA automationgovernment AIARPA-HDSARpublic records redaction

AI युग में FOIA: एजेंसियाँ कैसे सप्ताहों से घंटों में रेडैक्शन का समय कम कर रही हैं

संघीय सरकार ने 2024 में FOIA प्रोसेसिंग पर अनुमानित $500M खर्च किए। इसका अधिकांश भाग मैनुअल रेडैक्शन था। DOJ FOIA बैकलॉग 100,000 अनुरोधों से अधिक हो गया। HHS ने दस्तावेज़ किया कि इसकी CMS डिवीजन ने AI-संचालित रेडैक्शन का पता लगाया क्योंकि मैनुअल प्रोसेसिंग अस्वीकार्य बैकलॉग बना रही थी। ARPA-H ने 2025 में "रेडैक्शन करने के लिए कृत्रिम बुद्धिमत्ता का उपयोग करने और उचित परिश्रम के लिए ई-डिस्कवरी का उपयोग करने" के लिए AI रेडैक्शन सॉफ़्टवेयर की स्पष्ट रूप से मांग की।

यह मान्यता कि मैनुअल FOIA रेडैक्शन स्केल नहीं कर सकता अब संस्थागत है। प्रश्न "क्या हमें ऑटोमेट करना चाहिए?" से बदलकर "हम ऐसा ऑटोमेशन कैसे लागू करें जो बचाव योग्य, अदालत में स्वीकार्य आउटपुट उत्पन्न करे?" हो गया है।

संघीय FOIA बैकलॉग संकट

5 U.S.C. §552 के तहत, संघीय एजेंसियों को FOIA अनुरोधों का उत्तर 20 व्यावसायिक दिनों के भीतर देना चाहिए। एजेंसियाँ "असामान्य परिस्थितियों" का हवाला देकर अनुरोधकर्ता को सूचित करके समय सीमा बढ़ा सकती हैं। व्यावहारिक रूप से, कई एजेंसियाँ उत्तर देने के समय को महीनों से वर्षों में मापती हैं, दिनों में नहीं।

DOJ का 100,000+ अनुरोधों का बैकलॉग लगभग 2 बिलियन मिनटों का मैनुअल समीक्षा समय दर्शाता है यदि प्रत्येक अनुरोध में केवल 20 मिनट की समीक्षा शामिल है। सरकारी बिलिंग दरों पर, यह श्रम में अरबों डॉलर है — इसका अधिकांश भाग मानक PII की यांत्रिक पहचान और रेडैक्शन के लिए है।

बैकलॉग को बढ़ाने वाले अनुरोध जटिल कानूनी प्रश्न नहीं हैं जो वकील के निर्णय की आवश्यकता रखते हैं। ये दस्तावेज़-भारी अनुरोध हैं जहाँ 80% काम हजारों पृष्ठों पर नाम, पते और फोन नंबर खोजने के लिए हाईलाइटर चलाने में है — ऐसा काम जो एक एल्गोरिदम सेकंडों में करता है।

ARPA-H और HHS ने क्या पहचाना

ARPA-H (एडवांस्ड रिसर्च प्रोजेक्ट्स एजेंसी फॉर हेल्थ) ने FOIA दस्तावेज़ प्रोसेसिंग को संभालने के लिए विशेष रूप से डिज़ाइन किए गए AI रेडैक्शन सॉफ़्टवेयर की खरीद के लिए एक निविदा जारी की। आवश्यकताएँ:

  • FOIA छूट 6 और 7(C) PII की स्वचालित पहचान और रेडैक्शन
  • बड़े दस्तावेज़ सेट का बैच प्रोसेसिंग
  • मिश्रित प्रारूप समर्थन (PDF, Word, ईमेल प्रारूप)
  • ऑडिट ट्रेल दस्तावेज़ीकरण
  • FOIA प्रतिक्रिया के लिए उपयुक्त बचाव योग्य आउटपुट

HHS/CMS ने अपने संचालन समीक्षा में समान आवश्यकताओं का दस्तावेज़ीकरण किया, यह नोट करते हुए कि बढ़ती अनुरोध मात्रा और स्थिर स्टाफिंग का संयोजन मैनुअल प्रोसेसिंग को गणितीय रूप से अस्थायी बना देता है।

ये एजेंसियाँ अपने आप में अत्याधुनिक AI का पीछा नहीं कर रही हैं। ये एजेंसियाँ एक वैधानिक अनुपालन संकट का सामना कर रही हैं और पहचान रही हैं कि समाधान के लिए ऑटोमेशन की आवश्यकता है।

राज्य और स्थानीय सरकार: underserved समस्या

संघीय सरकार की FOIA चुनौती बड़ी है लेकिन संसाधित है — एजेंसियों के पास समर्पित FOIA कार्यालय, कानूनी समीक्षा के लिए बजट, और स्थापित वर्कफ़्लो हैं। राज्य और स्थानीय सरकारें समान वैधानिक दायित्वों का सामना करती हैं लेकिन संसाधनों का एक अंश।

कैलिफ़ोर्निया का CPRA (कैलिफ़ोर्निया पब्लिक रिकॉर्ड्स एक्ट) 10 कैलेंडर दिनों के भीतर उत्तर की आवश्यकता करता है। एक काउंटी जिसमें 3 लोगों की कानूनी टीम है, मैनुअल समीक्षा के माध्यम से उस विंडो के भीतर 2,000 दस्तावेज़ रिकॉर्ड अनुरोध को अवशोषित नहीं कर सकती। विकल्प हैं:

  1. अस्वीकार या देरी (कानूनी जोखिम पैदा करना)
  2. बड़े अनुरोधों के लिए अस्थायी कानूनी स्टाफ़ की भर्ती करना (महंगा, ऑनबोर्ड करने में धीमा)
  3. यांत्रिक रेडैक्शन चरण को ऑटोमेट करना

विकल्प 3 अब व्यवहार्य है। संघीय एजेंसियों के लिए उपलब्ध वही बैच प्रोसेसिंग क्षमता काउंटी कानूनी विभागों के लिए एंटरप्राइज खरीद समयरेखा के बिना सुलभ है।

EU सदस्य राज्य DSAR: वही समस्या, अलग अधिकार क्षेत्र

GDPR अनुच्छेद 15 डेटा विषय पहुंच अनुरोध (DSARs) EU संगठनों के लिए एक समान चुनौती पैदा करते हैं। FOIA (सरकारी-विशिष्ट) के विपरीत, DSAR दायित्व सभी संगठनों पर लागू होते हैं जो व्यक्तिगत डेटा प्रोसेस करते हैं। एक €10M वार्षिक राजस्व SaaS कंपनी को एक बड़े उद्यम के समान मात्रा में DSARs मिल सकते हैं, प्रतिक्रिया देने के लिए कम संसाधनों के साथ।

व्यावहारिक DSAR चुनौती FOIA के समान है: एक विशिष्ट व्यक्ति के बारे में सभी डेटा उत्पन्न करें, तीसरे पक्ष के PII को प्रतिक्रिया से रेडैक्ट किया गया हो, 30 दिनों के भीतर। प्रत्येक DSAR जिसमें ईमेल आर्काइव, समर्थन टिकट, और आदेश रिकॉर्ड शामिल हैं, तीसरे पक्ष के रेडैक्शन के लिए सैकड़ों दस्तावेज़ों की समीक्षा की आवश्यकता हो सकती है।

20-50 DSARs प्रति माह प्राप्त करने वाले संगठनों के लिए — एक स्तर जो वर्तमान मैनुअल प्रोसेसिंग दरों पर DSAR प्रतिक्रिया के लिए एक या अधिक FTE की आवश्यकता है — बैच ऑटोमेशन इसे अंशकालिक काम में घटित करता है।

डेस्कटॉप एप्लिकेशन: ऑफ़लाइन सरकारी प्रोसेसिंग

सरकारी एजेंसियाँ वर्गीकृत या संवेदनशील रिकॉर्ड संभालते समय एक बाधा का सामना करती हैं जिसे वेब-आधारित उपकरण संबोधित नहीं कर सकते: डेटा जो एजेंसी के बुनियादी ढाँचे से बाहर नहीं जा सकता।

डेस्कटॉप ऐप (anonym.plus) इसे सीधे संबोधित करता है:

  • सभी प्रोसेसिंग एजेंसी के हार्डवेयर पर स्थानीय रूप से होती है
  • कोई डेटा बाहरी सर्वरों पर नहीं भेजा जाता
  • प्रति रन 1-5,000 फ़ाइलों का बैच प्रोसेसिंग
  • मिश्रित प्रारूप समर्थन: PDF, DOCX, XLSX, TXT, CSV, JSON, XML
  • प्रोसेस की गई फ़ाइलों का ZIP पैकेजिंग
  • प्रति फ़ाइल प्रोसेसिंग मेटाडेटा के साथ CSV/JSON निर्यात

एजेंसियों के लिए जिनके पास एयर-गैप्ड नेटवर्क या सख्त डेटा निवास आवश्यकताएँ हैं, स्थानीय प्रोसेसिंग वैकल्पिक नहीं है — यह एकमात्र व्यवहार्य दृष्टिकोण है। डेस्कटॉप ऐप ऑफ़लाइन वातावरण में समान पहचान सटीकता (XLM-RoBERTa, 285+ संस्थाओं के प्रकार) प्रदान करता है।

सरकारी संदर्भों के लिए कार्यान्वयन विचार

ऑडिट ट्रेल आवश्यकताएँ: सरकारी रेडैक्शन वर्कफ़्लो को यह दस्तावेज़ीकरण करने की आवश्यकता होती है कि क्या रेडैक्ट किया गया, किस आधार पर, किसने, और कब। बैच संचालन से प्रोसेसिंग मेटाडेटा पहले दो तत्व प्रदान करता है। समीक्षा वर्कफ़्लो (एजेंसी स्टाफ द्वारा अपवाद समीक्षा) के माध्यम से राउटिंग बाद के दो को प्रदान करती है।

दस्तावेज़ सेट में निरंतरता: FOIA प्रतिक्रियाएँ जो कुछ दस्तावेज़ों में एक नाम को रेडैक्ट करती हैं लेकिन दूसरों में नहीं, कानूनी जोखिम पैदा करती हैं। निरंतर कॉन्फ़िगरेशन के साथ स्वचालित प्रोसेसिंग विभिन्न समीक्षकों द्वारा विभिन्न निर्णय लागू करने से उत्पन्न असंगति को समाप्त करती है।

संवेदनशील लेकिन असंरक्षित (SBU) हैंडलिंग: कई सरकारी दस्तावेज़ SBU होते हैं न कि वर्गीकृत। स्थानीय प्रोसेसिंग SBU सामग्रियों को बिना नेटवर्क ट्रांसमिशन के संभालती है। उचित DPA समझौतों के साथ EU-होस्टेड सर्वरों पर वेब-आधारित प्रोसेसिंग गैर-SBU सामग्रियों को संभालती है।

अदालत में स्वीकार्य रेडैक्शन प्रारूप: रेडैक्ट विधि (काले बार का प्रतिस्थापन) पारंपरिक FOIA रेडैक्शन की भौतिक उपस्थिति से मेल खाती है और अदालत में स्वीकार्य उत्पादन के लिए उपयुक्त है। प्रतिस्थापन टोकन दृष्टिकोण ([REDACTED - Exemption 6]) स्पष्ट छूट उद्धरण के साथ अधिक बारीकी से दस्तावेज़ीकरण प्रदान करता है।

निष्कर्ष

FOIA एक वैधानिक आवश्यकता है। 20-व्यावसायिक-दिनों की प्रतिक्रिया समय सीमा आकांक्षात्मक नहीं है — अनुपालन में विफलता कानूनी जोखिम और DPA/अदालत की हस्तक्षेप पैदा करती है। जब अनुरोध मात्रा मैनुअल प्रोसेसिंग की क्षमता से अधिक हो जाती है, तो प्रणालीगत विफलताएँ होती हैं।

AI-संचालित बैच रेडैक्शन एजेंसी के कानूनी निर्णय को प्रतिस्थापित नहीं करता। यह यांत्रिक चरण को समाप्त करता है — मानक PII की पहचान और हटाना जो समीक्षा समय का 70-80% लेता है। एजेंसी के कानूनी कर्मचारी 10-20% अपवाद दस्तावेज़ों पर फिर से ध्यान केंद्रित करते हैं जहाँ संदर्भ महत्वपूर्ण होता है।

ARPA-H ने इसे पहचाना। HHS/CMS ने इसे पहचाना। सबसे बड़े बैकलॉग का सामना करने वाली एजेंसियाँ ऑटोमेशन की ओर बढ़ रही हैं। राज्य और स्थानीय सरकारों और DSAR दायित्वों का सामना करने वाले EU संगठनों के लिए, वही समाधान लागू होता है।

स्रोत:

क्या आप अपने डेटा की सुरक्षा के लिए तैयार हैं?

48 भाषाओं में 285+ संस्थाओं के प्रकारों के साथ PII अनामकरण शुरू करें।