अनुचित रेडैक्शन की डबल जिम्मेदारी
कानूनी टीमें दो अलग-अलग रेडैक्शन विफलता मोड का सामना करती हैं, और दोनों जिम्मेदारी उत्पन्न करते हैं।
अंडर-रेडैक्शन विशेषाधिकारित सामग्री, गोपनीय व्यावसायिक जानकारी, या व्यक्तिगत डेटा को उजागर करता है जिसे रोकना चाहिए था। उत्पादन करने वाली पार्टी ने ऐसी सामग्री का खुलासा किया है जिसे उसे सुरक्षित रखने का अधिकार था — और कुछ मामलों में, बाध्यता भी।
ओवर-रेडैक्शन उन प्रतिक्रियाशील जानकारी को रोकता है जिसे विरोधी वकील प्राप्त करने के लिए हकदार है। उत्पादन करने वाली पार्टी ने खोज प्रक्रिया में बाधा डाली है, संभावित रूप से अवैध विशेषाधिकार दावों के पीछे सबूत छुपा रही है। अदालतें ओवर-रेडैक्शन को दंड के अधीन खोज उल्लंघन के रूप में मानती हैं।
AI-सहायता प्राप्त रेडैक्शन उपकरण जो सटीकता के मुकाबले पुनः प्राप्ति को प्राथमिकता देते हैं — संभावित संवेदनशील सामग्री को अधिकतम रूप से चिह्नित करते हैं — प्रणालीगत रूप से दूसरे विफलता मोड का उत्पादन करते हैं। जब एक AI रेडैक्शन इंजन एक दस्तावेज़ की सामग्री का 80% इस सुनिश्चित करने के लिए रेडेक्ट करता है कि यह कुछ भी विशेषाधिकारित न चूक जाए, तो परिणामी उत्पादन कार्यात्मक रूप से बेकार और संभावित रूप से दंडनीय होता है।
एथलेटिक्स इन्वेस्टमेंट ग्रुप बनाम श्निट्ज़र स्टील (2024)
2024 का मामला एथलेटिक्स इन्वेस्टमेंट ग्रुप बनाम श्निट्ज़र स्टील ई-डिस्कवरी में अनुचित रेडैक्शन के प्रति न्यायिक प्रतिक्रिया को दर्शाता है।
इस मामले में एक व्यावसायिक विवाद शामिल था जिसमें एक पार्टी के दस्तावेज़ उत्पादन में ऐसे रेडैक्शन शामिल थे जिन्हें विरोधी वकील ने अन्यायपूर्ण बताया। अदालत ने रेडेक्टेड सामग्रियों की जांच की और पाया कि रेडैक्शन विशेषाधिकार कानून या गोपनीयता सिद्धांतों द्वारा अनुमत से अधिक थे।
परिणाम: खोज दंड। अदालत ने अनुचित रेडैक्शन के लिए उत्पादन करने वाली पार्टी पर दंड लगाया — यह एक उपाय है जो खोज उल्लंघनों के लिए संघीय नागरिक प्रक्रिया नियम 37 के तहत उपलब्ध है। उत्पादन करने वाली पार्टी ने एक अपर्याप्त रेडैक्शन प्रक्रिया का उपयोग करने का बोझ उठाया।
यह मामला महत्वपूर्ण है क्योंकि ओवर-रेडैक्शन दंड नए नहीं हैं — अदालतों ने वर्षों से इन्हें दिया है — बल्कि इसलिए कि यह एक मुकदमेबाजी परिदृश्य में हुआ जहां AI-सहायता प्राप्त समीक्षा उपकरण अब सामान्य हैं। मामला यह सवाल उठाता है कि क्या कानूनी टीमों ने उत्पादन के लिए उन AI रेडैक्शन उपकरणों की सटीकता विशेषताओं का मूल्यांकन किया है।
22.7% सटीकता समस्या
Presidio, जो Microsoft द्वारा विकसित एक ओपन-सोर्स PII पहचान इंजन है और कानूनी प्रौद्योगिकी अनुप्रयोगों में व्यापक रूप से उपयोग किया जाता है, स्वतंत्र बेंचमार्किंग में कानूनी दस्तावेजों पर 22.7% सटीकता दर प्राप्त करता है।
सटीकता मापती है कि उपकरण की सकारात्मक पहचान कितनी बार सही होती है। 22.7% सटीकता दर का अर्थ है कि लगभग 100 में से 77 आइटम जो उपकरण द्वारा संवेदनशील के रूप में चिह्नित किए गए हैं, वास्तव में संवेदनशीलता सीमा को पूरा नहीं करते हैं।
एक ई-डिस्कवरी अनुप्रयोग के लिए, इसका सीधा परिचालन प्रभाव है। 10,000 दस्तावेजों का उत्पादन सेट जो 22.7% सटीकता प्राप्त करने वाले उपकरण के साथ संसाधित किया गया है, उसमें हजारों रेडैक्शन होंगे जिनका कोई वैध विशेषाधिकार या गोपनीयता आधार नहीं है। जो उत्पादन करने वाली पार्टी उस आउटपुट पर निर्भर करती है, उसे एथलेटिक्स इन्वेस्टमेंट ग्रुप की पार्टी के समान जोखिम का सामना करना पड़ता है: एक उत्पादन जिसे विरोधी वकील चुनौती देगा, एक अदालत जो रेडेक्टेड सामग्री की जांच करेगी, और यदि रेडैक्शन को सही ठहराया नहीं जा सकता है तो दंड।
22.7% का आंकड़ा Presidio के कानूनी सामग्री पर आउट-ऑफ-बॉक्स कॉन्फ़िगरेशन को दर्शाता है। यह सभी AI-सहायता प्राप्त रेडैक्शन उपकरणों का प्रतिनिधित्व नहीं करता — लेकिन यह कानूनी प्रौद्योगिकी एकीकरण में सबसे सामान्य रूप से तैनात ओपन-सोर्स इंजन का बुनियादी प्रदर्शन दर्शाता है।
सटीकता समस्या संरचनात्मक है: सामान्य पाठ कॉर्पोरा पर प्रशिक्षित NLP-आधारित इकाई पहचान प्रणाली कानूनी भाषा पर अलग तरीके से प्रदर्शन करती हैं, जो कला के शब्दों, संक्षेपों, दस्तावेज़ प्रारूपण परंपराओं और संदर्भ संरचनाओं का उपयोग करती हैं जो प्रशिक्षण डेटा से भिन्न होती हैं। एक उपकरण जो चिकित्सा रिकॉर्ड या वित्तीय विवरणों पर स्वीकार्य सटीकता प्राप्त करता है, वह डिपोजिशन ट्रांसक्रिप्ट, पत्राचार, और अनुबंध प्रदर्शनों पर काफी खराब प्रदर्शन कर सकता है।
AI चैटबॉट सामग्री विश्लेषण क्या प्रकट करता है
कानूनी प्रथा में AI उपकरणों को अपनाने का संदर्भ उपयोग डेटा द्वारा स्थापित किया गया है: AI चैटबॉट सामग्री का 27.4% संवेदनशील है, उद्यम AI उपकरण उपयोग पैटर्न के स्वतंत्र विश्लेषण के अनुसार।
यह आंकड़ा बताता है कि कर्मचारी कार्य कार्यों के लिए AI उपकरणों का उपयोग करते समय क्या प्रस्तुत करते हैं — न कि डेटा जो उन्होंने जानबूझकर साझा किया, बल्कि आकस्मिक रूप से संवेदनशील सामग्री शामिल की। कानूनी पेशेवर जो AI उपकरणों का उपयोग करके पत्राचार तैयार करते हैं, डिपोजिशन का सारांश बनाते हैं, अनुबंधों का विश्लेषण करते हैं, या मामले के कानून की खोज करते हैं, संवेदनशील सामग्री AI प्लेटफार्मों में सामान्य कार्य का उपोत्पाद के रूप में प्रवेश करती है।
27.4% का आंकड़ा स्थापित करता है कि कानूनी वातावरण में AI उपकरणों के साथ लगभग तीन में से एक इंटरैक्शन संवेदनशील सामग्री शामिल करता है — ग्राहक जानकारी, विशेषाधिकारित संचार, गोपनीय मामले की रणनीति, या विरोधी पार्टी डेटा। यह सामग्री AI प्रदाता की अवसंरचना तक उपयोग योग्य रूप में पहुँचती है जब तक कि तकनीकी नियंत्रण पहले इसे रोक न दें।
कानूनी फर्मों के लिए जो अपने AI सुरक्षा स्थिति का मूल्यांकन कर रही हैं, 27.4% कोई सीमांत जोखिम नहीं है। यह बुनियादी धारणा है: कानूनी वातावरण में AI उपकरणों के उपयोग का लगभग एक तिहाई ऐसा सामग्री शामिल करेगा जिसे सुरक्षा की आवश्यकता है।
कैस्केडिंग जिम्मेदारी श्रृंखला
ओवर-रेडैक्शन और AI उपकरण डेटा एक्सपोजर कानूनी टीमों के लिए अलग लेकिन संबंधित जिम्मेदारी श्रृंखलाएँ बनाते हैं।
ओवर-रेडैक्शन जिम्मेदारी श्रृंखला: AI उपकरण दस्तावेज़ों को अधिकतम रूप से चिह्नित करता है → वकील आउटपुट की समीक्षा करता है बिना प्रत्येक रेडैक्शन की व्यक्तिगत रूप से जांच किए → उत्पादन अन्यायपूर्ण रेडैक्शन के साथ प्रस्तुत किया जाता है → विरोधी वकील चुनौती देता है → अदालत जांच करती है → दंड।
AI एक्सपोजर जिम्मेदारी श्रृंखला: वकील मामले के काम में सहायता के लिए AI उपकरण का उपयोग करता है → AI उपकरण विशेषाधिकारित ग्राहक संचार, गोपनीय रणनीतियाँ, या संवेदनशील मामले का डेटा प्राप्त करता है → AI विक्रेता की अवसंरचना में सेंध लगाई जाती है → ग्राहक डेटा उजागर होता है → वकील-ग्राहक विशेषाधिकार संभावित रूप से प्रभावित होता है → पेशेवर लापरवाही का जोखिम।
दोनों श्रृंखलाएँ एक ही बिंदु से शुरू होती हैं: कानूनी टीमें AI उपकरणों को तैनात कर रही हैं बिना उन उपकरणों की तकनीकी विशेषताओं को समझे या कानूनी कार्य के लिए उपयुक्त नियंत्रण लागू किए।
कानूनी उत्पादन के लिए सटीकता-प्रथम रेडैक्शन
रेडैक्शन के लिए न्यायिक मानक पुनः प्राप्ति-ऑप्टिमाइज्ड नहीं है। अदालतें चुनौती दी गई रेडैक्शन का मूल्यांकन करते समय पूछती हैं कि क्या प्रत्येक विशिष्ट रेडैक्शन विशेषाधिकार, गोपनीयता सिद्धांत, या लागू सुरक्षा आदेश द्वारा उचित था — न कि यह कि उत्पादन करने वाली पार्टी के उपकरण ने सुरक्षित रहने के लिए अधिकतम चिह्नित किया।
एक रेडैक्शन जिसे सही ठहराया नहीं जा सकता, वह खोज उल्लंघन है चाहे वह मानव समीक्षक द्वारा उत्पादित हो या AI उपकरण द्वारा। अदालत की जांच दस्तावेज़-विशिष्ट होती है, प्रणाली-स्तरीय नहीं।
कानूनी टीमों के लिए, परिचालन प्रभाव यह है कि रेडैक्शन उपकरणों का मूल्यांकन सटीकता पर होना चाहिए — चिह्नित आइटम का प्रतिशत जो वास्तव में विशेषाधिकारित या गोपनीय है — न कि केवल पुनः प्राप्ति। एक उपकरण जो 22.7% सटीकता के साथ 90% पुनः प्राप्ति प्राप्त करता है, वह अधिक संवेदनशील सामग्री को पकड़ सकता है, लेकिन यह 77.3% झूठे सकारात्मक के लिए एक मैनुअल समीक्षा बोझ डालता है और जब वह समीक्षा नहीं होती है तो प्रणालीगत ओवर-रेडैक्शन जोखिम उत्पन्न करता है।
कानूनी वातावरण दस्तावेज़ स्तर पर सटीकता की मांग करता है। उत्पादन में प्रत्येक रेडैक्शन अदालत के लिए एक निहित दावा का प्रतिनिधित्व करता है कि रेडेक्टेड सामग्री वास्तव में रोकी गई है। एथलेटिक्स इन्वेस्टमेंट ग्रुप के बाद का मानक स्पष्ट है: उस दावे को सटीक होना चाहिए।
स्रोत: