अनुचित रिडैक्शन की दोहरी देनदारी
कानूनी टीमों को दो अलग रिडैक्शन विफलता मोड का सामना करना पड़ता है, और दोनों देनदारी बनाते हैं।
अंडर-रिडैक्शन विशेषाधिकार प्राप्त सामग्री, गोपनीय व्यावसायिक जानकारी, या व्यक्तिगत डेटा को उजागर करती है जिसे रोका जाना चाहिए था। उत्पादन पक्ष ने उस सामग्री का खुलासा किया है जिसे उसे सुरक्षित रखने का अधिकार था — और कुछ मामलों में दायित्व भी।
ओवर-रिडैक्शन प्रतिक्रियाशील जानकारी को रोकती है जिसे विपक्षी वकील को प्राप्त करने का अधिकार है। उत्पादन पक्ष ने डिस्कवरी प्रक्रिया में बाधा डाली है, संभवतः अवैध विशेषाधिकार दावों के पीछे साक्ष्य छिपाए हैं। न्यायालय ओवर-रिडैक्शन को प्रतिबंधों के अधीन डिस्कवरी उल्लंघन मानते हैं।
AI-सहायता प्राप्त रिडैक्शन टूल जो रीकॉल पर सटीकता को प्राथमिकता देते हैं — अधिकतम रूप से संभावित संवेदनशील सामग्री को फ़्लैग करते हैं — व्यवस्थित रूप से दूसरी विफलता मोड उत्पन्न करते हैं। जब एक AI रिडैक्शन इंजन किसी दस्तावेज़ की 80% सामग्री को रिडैक्ट करता है ताकि कुछ भी विशेषाधिकार प्राप्त न छूटे, तो परिणामी उत्पादन कार्यात्मक रूप से बेकार और संभावित रूप से प्रतिबंधनीय है।
Athletics Investment Group v. Schnitzer Steel (2024)
2024 का मामला Athletics Investment Group v. Schnitzer Steel e-discovery में अनुचित रिडैक्शन के प्रति न्यायिक प्रतिक्रिया को स्पष्ट करता है।
इस मामले में एक वाणिज्यिक विवाद शामिल था जिसमें एक पक्ष के दस्तावेज़ उत्पादन में रिडैक्शन शामिल थे जिन्हें विपक्षी वकील ने अनुचित बताकर चुनौती दी। न्यायालय ने रिडैक्ट सामग्री की जांच की और पाया कि रिडैक्शन विशेषाधिकार कानून या गोपनीयता सिद्धांतों द्वारा अनुमत से अधिक थी।
परिणाम: डिस्कवरी प्रतिबंध। न्यायालय ने अनुचित रिडैक्शन के लिए उत्पादन पक्ष पर दंड लगाया — एक उपाय जो डिस्कवरी उल्लंघनों के लिए Civil Procedure के Federal Rule 37 के तहत उपलब्ध है। उत्पादन पक्ष को अपर्याप्त रिडैक्शन प्रक्रिया का उपयोग करने का बोझ उठाना पड़ा।
यह मामला महत्वपूर्ण है, न इसलिए कि ओवर-रिडैक्शन प्रतिबंध नए हैं — न्यायालयों ने वर्षों से उन्हें दिया है — बल्कि इसलिए कि यह एक ऐसे मुकदमेबाज़ी परिदृश्य में हुआ जहां AI-सहायता प्राप्त समीक्षा टूल अब सामान्य हैं। यह मामला जो प्रश्न उठाता है वह यह है कि क्या कानूनी टीमों ने उत्पादन के लिए उन पर भरोसा करने से पहले अपने AI रिडैक्शन टूल की सटीकता विशेषताओं का मूल्यांकन किया है।
22.7% सटीकता की समस्या
Presidio, Microsoft द्वारा विकसित ओपन-सोर्स PII डिटेक्शन इंजन और कानूनी प्रौद्योगिकी अनुप्रयोगों में व्यापक रूप से उपयोग किया जाता है, स्वतंत्र बेंचमार्किंग में कानूनी दस्तावेज़ों पर 22.7% सटीकता दर प्राप्त करता है।
सटीकता मापती है कि टूल की सकारात्मक पहचानें कितनी बार सही होती हैं। 22.7% सटीकता दर का मतलब है कि टूल द्वारा संवेदनशील के रूप में फ़्लैग की गई हर 100 वस्तुओं में से लगभग 77 वास्तव में उस संवेदनशीलता सीमा को पूरा नहीं करतीं जिसके लिए उन्हें फ़्लैग किया गया था।
e-discovery अनुप्रयोग के लिए, इसके सीधे परिचालन परिणाम हैं। 22.7% सटीकता प्राप्त करने वाले टूल के साथ संसाधित 10,000 दस्तावेज़ों के उत्पादन सेट में हज़ारों रिडैक्शन होंगी जिनका कोई वैध विशेषाधिकार या गोपनीयता आधार नहीं है। जो उत्पादन पक्ष उस आउटपुट पर निर्भर करता है, उसे Athletics Investment Group के पक्ष के समान जोखिम का सामना करना पड़ता है: एक उत्पादन जिसे विपक्षी वकील चुनौती देगा, एक न्यायालय जो रिडैक्ट सामग्री की जांच करेगा, और प्रतिबंध अगर रिडैक्शन को उचित नहीं ठहराया जा सकता।
22.7% का आंकड़ा कानूनी सामग्री पर Presidio के आउट-ऑफ-बॉक्स कॉन्फ़िगरेशन को दर्शाता है। यह सभी AI-सहायता प्राप्त रिडैक्शन टूल का प्रतिनिधित्व नहीं करता — लेकिन यह कानूनी प्रौद्योगिकी एकीकरण में सबसे आम रूप से तैनात ओपन-सोर्स इंजन के बेसलाइन प्रदर्शन का प्रतिनिधित्व करता है।
सटीकता की समस्या संरचनात्मक है: सामान्य पाठ कॉर्पस पर प्रशिक्षित NLP-आधारित इकाई पहचान प्रणालियां कानूनी भाषा पर अलग तरह से प्रदर्शन करती हैं, जो तकनीकी शब्दों, संक्षेप, दस्तावेज़ प्रारूपण सम्मेलनों और उद्धरण संरचनाओं का उपयोग करती है जो प्रशिक्षण डेटा से भिन्न हैं।
AI चैटबॉट सामग्री विश्लेषण क्या प्रकट करता है
कानूनी अभ्यास में AI टूल अपनाने का संदर्भ उपयोग डेटा द्वारा स्थापित किया जाता है: एंटरप्राइज़ AI टूल उपयोग पैटर्न के स्वतंत्र विश्लेषण के अनुसार, 27.4% AI चैटबॉट सामग्री संवेदनशील है।
यह आंकड़ा वर्णन करता है कि कर्मचारी कार्य कार्यों के लिए AI टूल का उपयोग करते समय क्या सबमिट करते हैं — वह डेटा नहीं जो उन्होंने जानबूझकर साझा किया, बल्कि संवेदनशील सामग्री जो संयोग से शामिल हुई। कानूनी पेशेवरों के लिए जो AI टूल का उपयोग पत्राचार का मसौदा तैयार करने, जमानत का सारांश बनाने, अनुबंधों का विश्लेषण करने या मामला कानून का शोध करने के लिए करते हैं, संवेदनशील सामग्री सामान्य कार्य के उपोत्पाद के रूप में AI प्लेटफ़ॉर्म में प्रवेश करती है।
27.4% का आंकड़ा स्थापित करता है कि कानूनी वातावरण में AI टूल के साथ लगभग तीन में से एक इंटरैक्शन में संवेदनशील सामग्री शामिल होती है — ग्राहक जानकारी, विशेषाधिकार प्राप्त संचार, गोपनीय मामला रणनीति, या विपक्षी पक्ष डेटा। वह सामग्री AI प्रदाता के बुनियादी ढांचे तक उपयोग करने योग्य रूप में पहुंचती है जब तक तकनीकी नियंत्रण पहले इसे नहीं रोकते।
कैस्केडिंग देनदारी श्रृंखला
ओवर-रिडैक्शन और AI टूल डेटा एक्सपोज़र कानूनी टीमों के लिए अलग लेकिन संबंधित देनदारी श्रृंखलाएं बनाते हैं।
ओवर-रिडैक्शन देनदारी श्रृंखला: AI टूल दस्तावेज़ों को अधिकतम रूप से फ़्लैग करता है → वकील प्रत्येक रिडैक्शन की जांच किए बिना आउटपुट की समीक्षा करता है → अनुचित रिडैक्शन के साथ उत्पादन सबमिट → विपक्षी वकील चुनौती → न्यायालय जांच → प्रतिबंध।
AI एक्सपोज़र देनदारी श्रृंखला: वकील मामले के काम में सहायता के लिए AI टूल का उपयोग करता है → AI टूल को विशेषाधिकार प्राप्त ग्राहक संचार, गोपनीय रणनीतियां, या संवेदनशील मामला डेटा मिलता है → AI विक्रेता बुनियादी ढांचा भेदा जाता है → ग्राहक डेटा उजागर → वकील-ग्राहक विशेषाधिकार संभावित रूप से प्रभावित → कदाचार एक्सपोज़र।
दोनों श्रृंखलाएं एक ही बिंदु से शुरू होती हैं: कानूनी टीमें AI टूल की तकनीकी विशेषताओं को समझे बिना उन्हें तैनात कर रही हैं या कानूनी काम के लिए उचित नियंत्रण लागू किए बिना।
कानूनी उत्पादन के लिए सटीकता-प्रथम रिडैक्शन
रिडैक्शन के लिए न्यायिक मानक रीकॉल-अनुकूलित नहीं है। चुनौती दी गई रिडैक्शन का मूल्यांकन करते समय न्यायालय पूछते हैं कि क्या प्रत्येक विशिष्ट रिडैक्शन विशेषाधिकार, गोपनीयता सिद्धांत, या लागू सुरक्षात्मक आदेश द्वारा उचित थी — न कि कि उत्पादन पक्ष के टूल ने जितना संभव हो सके सुरक्षित रहने के लिए उतना फ़्लैग किया या नहीं।
एक रिडैक्शन जिसे उचित नहीं ठहराया जा सकता, वह डिस्कवरी उल्लंघन है चाहे वह एक मानव समीक्षक या एक AI टूल द्वारा उत्पन्न की गई हो। न्यायालय की जांच दस्तावेज़-विशिष्ट है, सिस्टम-स्तर नहीं।
कानूनी टीमों के लिए, परिचालन निहितार्थ यह है कि रिडैक्शन टूल का मूल्यांकन सटीकता पर किया जाना चाहिए — फ़्लैग की गई वस्तुओं का प्रतिशत जो वैध रूप से विशेषाधिकार प्राप्त या गोपनीय हैं — न कि केवल रीकॉल पर। Athletics Investment Group के बाद का मानक स्पष्ट है: उत्पादन में प्रत्येक रिडैक्शन न्यायालय के प्रति एक अंतर्निहित दावे का प्रतिनिधित्व करती है कि रिडैक्ट सामग्री वैध रूप से रोकी गई है। वह दावा सटीक होना आवश्यक है।
स्रोत: