title: "कानूनी PII: विशेषाधिकार पहचान" description: "केस संदर्भ संख्याएँ, बार एडमिशन नंबर, कोर्ट डॉकेट नंबर, और क्लाइंट मैटर ID कानूनी रूप से संवेदनशील पहचानकर्ता हैं जिन्हें मानक PII टूल छोड़ देते हैं।" category: legal-tech publishedAt: 2026-06-03 tags:
- attorney-client privilege
- legal document review
- case numbers
- law firm privacy
- legal tech readingTime: 7
AI के युग में अटॉर्नी-क्लाइंट विशेषाधिकार: वे कानूनी PII जो आपके अनामीकरण टूल को पहचाननी ही चाहिए
मानक PII टूल नाम, ईमेल और SSN पकड़ते हैं। वे केस रेफरेंस ID, बार एडमिशन नंबर और क्लाइंट मैटर टैग चूक जाते हैं। ये विशेषाधिकार से जुड़े गंभीर जोखिम उठाते हैं। जेनेरिक टूल वह अंतर खुला छोड़ देते हैं।
लॉ फर्में हर रोज फाइलें AI टूल्स को भेजती हैं। उन फाइलों में मानक PII के साथ-साथ विशेषाधिकार-संवेदनशील मार्कर होते हैं जिन्हें मानक टूल नहीं पकड़ते।
जब कोई लॉ फर्म AI असिस्टेंट के जरिए फाइलें रूट करती है, तो उन फाइलों में मानक PII के साथ कानूनी ID भी होती हैं:
- क्लाइंट मैटर टैग: पूरी मैटर फाइल से जुड़ते हैं और क्लाइंट का नाम उजागर करते हैं
- केस रेफरेंस ID: कोर्ट-असाइन्ड कोड जो निजी विवरण के साथ सार्वजनिक रिकॉर्ड से जुड़ते हैं
- बार एडमिशन नंबर: सार्वजनिक स्टेट डायरेक्टरी में खोजे जा सकने वाले अटॉर्नी ID
- कोर्ट डॉकेट कोड: सार्वजनिक फाइलिंग सिस्टम से जुड़ते हैं जिनमें पूरा केस इतिहास होता है
- जुडिशियल असाइनमेंट कोड: संवेदनशील स्थितियों में पीठासीन न्यायाधीश की पहचान करते हैं
इनमें से कोई भी, किसी बाहरी AI विक्रेता को भेजा जाए, तो संभावित विशेषाधिकार समस्या पैदा होती है।
इन ID को कस्टम डिटेक्शन की आवश्यकता क्यों है
कोर्ट डॉकेट फॉर्मेट जिला स्तर के पैटर्न का पालन करते हैं। कोई एकल पैटर्न सभी संघीय और राज्य न्यायालयों को कवर नहीं करता।
संघीय नागरिक मामले दो-अंकीय वर्ष, फिर "cv", फिर केस नंबर का उपयोग करते हैं। आपराधिक मामले उसी स्थान पर "cr" का उपयोग करते हैं। राज्य न्यायालय क्षेत्र के अनुसार भिन्न होते हैं और कोई साझा मानक नहीं है।
बार एडमिशन नंबर राज्य-विशिष्ट हैं। California संख्यात्मक प्रारूप का उपयोग करता है। New York रजिस्ट्री प्रारूप का। Texas अपना बार ID प्रारूप। कोई राष्ट्रीय प्रारूप मौजूद नहीं है।
क्लाइंट मैटर टैग फर्म-विशिष्ट हैं। प्रत्येक फर्म अपना प्रारूप बनाती है। वर्ष-क्लाइंट-मैटर। प्रैक्टिस ग्रुप कोड। अनुक्रमिक ID।
मानक PII टूल कस्टम सेटअप के बिना इनमें से कोई भी नहीं जान सकते।
अंतर वास्तविक है। एक दस्तावेज़ टूल को पूरा मैटर संदर्भ प्राप्त होता है। डॉकेट कोड सार्वजनिक रिकॉर्ड से जुड़ते हैं। क्लाइंट टैग मौजूद हैं। टूल रिपोर्ट करता है कि PII हटाई गई। नाम और ईमेल हटाए गए थे। विशेषाधिकार-संवेदनशील ID नहीं।
कानूनी AI स्टार्टअप का मामला
एक कानूनी AI स्टार्टअप लॉ फर्मों के लिए दस्तावेज़ टूल बनाती है। उत्पाद डिस्कवरी फाइलें स्कैन करता है, प्रासंगिक खंडों की पहचान करता है, और संभावित विशेषाधिकार सामग्री को फ्लैग करता है। एंटरप्राइज़ क्लाइंट प्रोसेसिंग से पहले मानक PII के साथ क्लाइंट मैटर टैग के संशोधन की मांग करते हैं।
कंप्लायंस बाधा: AI टूल क्लाइंट मैटर टैग युक्त फाइल डेटा प्रोसेस करता है। सार्वजनिक कोर्ट फाइलिंग के साथ, वे टैग मैटर पहचान की अनुमति दे सकते हैं। एंटरप्राइज़ लीगल ऑप्स टीमें इसे अस्वीकार्य मानती हैं।
कस्टम एंटिटी डिटेक्शन से पहले:
- डील रिव्यू में कंप्लायंस गैप मिलता है
- कस्टम NLP मॉडल के लिए 3+ महीने की इंजीनियरिंग कतार
- एंटरप्राइज़ कॉन्ट्रैक्ट लंबित
कस्टम एंटिटी API के साथ:
- कंप्लायंस अधिकारी ऑनबोर्डिंग पर मैटर टैग फॉर्मेट परिभाषित करता है
- नमूना फाइलों के विरुद्ध पैटर्न परीक्षण: 2 दिन
- पाइपलाइन में कस्टम एंटिटी जोड़ी: 1 और दिन
- एंटरप्राइज़ कॉन्ट्रैक्ट आगे बढ़ता है
अंतर 3 दिन बनाम 3+ महीने है। काम पैटर्न सेटअप और API एकीकरण है। कोई NLP मॉडल प्रशिक्षण आवश्यक नहीं।
श्रेणी के अनुसार सामान्य प्रारूप
संघीय कोर्ट डॉकेट:
संघीय नागरिक मामले उपयोग करते हैं: दो-अंकीय वर्ष + "cv" + 4–6 अंकीय केस नंबर। उदाहरण: 24-cv-12345। आपराधिक मामले उसी स्थान पर "cr" का उपयोग करते हैं। दिवालियापन मामले "bk" का उपयोग करते हैं। अपीलें दो-अंकीय वर्ष और सर्किट के अनुसार भिन्न 4–5 अंकीय संख्या का उपयोग करती हैं।
राज्य न्यायालय प्रारूप (उदाहरण):
California Superior Court छह-अंकीय उपसर्ग प्रणाली का उपयोग करती है। New York वर्ष और अनुक्रम के साथ इंडेक्स प्रारूप का उपयोग करती है। Texas वर्ष, अनुक्रम और कोर्ट कोड के साथ कारण प्रारूप का उपयोग करती है।
क्लाइंट मैटर टैग (सामान्य फर्म प्रारूप):
अधिकांश फर्मों में तीन सामान्य पैटर्न दिखते हैं:
- दो-अंकीय वर्ष, क्लाइंट ID, मैटर अनुक्रम (जैसे, 24-ACME-001)
- प्रैक्टिस ग्रुप आद्याक्षर, वर्ष, फिर चार-अंकीय अनुक्रम (जैसे, LIT240042)
- छह-अंकीय ID के साथ क्लाइंट उपसर्ग (जैसे, SMITHCO-000123)
US बार एडमिशन ID:
अधिकांश राज्य 4–8 अंकीय संख्याओं का उपयोग करते हैं, कभी-कभी राज्य-स्तरीय उपसर्ग के साथ। USDC एडमिशन ID जिले के अनुसार भिन्न होती हैं और साझा प्रारूप का पालन नहीं करतीं।
विशेषाधिकार-सचेत प्रसंस्करण पाइपलाइन
दस्तावेज़ समीक्षा AI के लिए, एक स्तरीय पाइपलाइन पूरे दायरे को संभालती है।
परत 1 — मानक PII डिटेक्शन
नाम, ईमेल, फोन नंबर, पते, SSN। उच्च सटीकता। अच्छी तरह से स्थापित टूलिंग इस परत को अच्छी तरह संभालती है।
परत 2 — कस्टम कोड डिटेक्शन
मैटर कोड, डॉकेट ID, बार ID। ऑनबोर्डिंग पर सेट किए गए फर्म-विशिष्ट पैटर्न। यह परत वह अंतर भरती है जो मानक टूल चूक जाते हैं।
परत 3 — विशेषाधिकार समीक्षा (मानव)
स्वचालित डिटेक्शन के बाद, एक अटॉर्नी फ्लैग किए गए मार्करों की समीक्षा करता है। ATTORNEY-CLIENT हेडर। WORK PRODUCT लेबल। CONFIDENTIAL चिह्न। इस परत पर मानव समीक्षा वैकल्पिक नहीं है।
परत 4 — संदर्भ अपवाद समीक्षा
सार्वजनिक रिकॉर्ड डॉकेट जो कोई विशेषाधिकार जोखिम नहीं उठाते बनाम क्लाइंट मैटर टैग जो उठाते हैं। इसके लिए अटॉर्नी निर्णय की आवश्यकता है। इसे स्वचालित नहीं किया जा सकता।
परतें 1 और 2 उच्च-मात्रा कार्य संभालती हैं। परतें 3 और 4 अटॉर्नी निर्णय को वहीं रखती हैं जहाँ विशेषाधिकार निर्णय संबंधित हैं। AI टूल उपयोग द्वारा विशेषाधिकार पहले से माफ होने पर क्या होता है, इसके लिए देखें attorney-client privilege and AI।
डेवलपर्स के लिए सेटअप
ऑनबोर्डिंग कॉन्फ़िगरेशन
एंटरप्राइज़ ऑनबोर्डिंग के दौरान क्लाइंट मैटर टैग प्रारूप एकत्र करें। प्रत्येक फर्म अलग प्रारूप का उपयोग करती है। उन्हें फर्म-विशिष्ट कस्टम एंटिटी के रूप में संग्रहीत करें। उस खाते के सभी प्रसंस्करण पर लागू करें।
डिफ़ॉल्ट प्रीसेट
पूर्व-निर्मित प्रीसेट कस्टम कार्य के बिना सामान्य संदर्भों को कवर करते हैं:
- "Federal Court Documents" — नागरिक, आपराधिक और दिवालियापन के लिए संघीय डॉकेट पैटर्न
- "State Court Documents (CA/NY/TX)" — तीन प्रमुख क्षेत्राधिकारों के लिए राज्य-विशिष्ट प्रारूप
- "Internal Operations" — मैटर टैग प्लस मानक PII
- "Outside Counsel Portal" — बिल संदर्भ, मैटर टैग, और मानक PII
ऑडिट दस्तावेज़ीकरण
प्रसंस्करण रिकॉर्ड दिखाने चाहिए कि कस्टम कोड प्रत्येक डिटेक्शन पास में शामिल थे। यह विश्लेषण विधि के लिए वर्क प्रोडक्ट सुरक्षा का समर्थन करता है।
मुकदमेबाजी में रिडेक्शन लागत कैसे बढ़ती है, इस पर व्यापक दृष्टिकोण के लिए देखें e-discovery PII automation and legal review cost reduction।
निष्कर्ष
विशेषाधिकार-संवेदनशील ID मानक PII जितनी ही जोखिमपूर्ण हैं — अक्सर अधिक। जो टूल डॉकेट कोड और मैटर टैग चूक जाते हैं वे दस्तावेज़ वर्कफ़्लो में वास्तविक अंतर छोड़ते हैं।
समाधान NLP मॉडल नहीं है। यह पैटर्न सेटअप है। लॉ फर्म टूल बनाने वाले डेवलपर्स के लिए, यही 3-दिन के फिक्स और 3-महीने के प्रोजेक्ट के बीच का अंतर है। लॉ फर्मों के लिए, यह रक्षात्मक AI-सहायता प्राप्त समीक्षा और विशेषाधिकार माफी जोखिम के बीच का अंतर है।