एक अनुपालन जोखिम हल करके दूसरा बनाने की समस्या
जो संगठन AI टूल के डेटा लीकेज जोखिम को समझ चुके हैं, वे अक्सर एक तार्किक-दिखने वाला समाधान लागू करते हैं: AI प्रदाताओं तक पहुंचने से पहले संवेदनशील सामग्री को अनामीकृत करना, स्थायी या एकतरफ़ा अनामीकरण का उपयोग करके जिसे उलटा नहीं किया जा सकता।
सुरक्षा पक्ष पर तर्क सही है। Cyberhaven के Q4 2025 विश्लेषण ने पाया कि ChatGPT को सबमिट की गई 34.8% सामग्री में संवेदनशील जानकारी होती है। Ponemon Institute के 2024 शोध ने स्थापित किया कि AI डेटा लीक की औसत लागत $2.1 मिलियन है। eSecurity Planet और Cyberhaven के शोध ने पाया कि 77% कर्मचारी साप्ताहिक आधार पर AI टूल के साथ संवेदनशील डेटा साझा करते हैं। जोखिम वास्तविक, बार-बार और महंगा है।
लेकिन स्थायी अनामीकरण — अपरिवर्तनीय एकतरफ़ा हैशिंग, विनाशकारी रिडैक्शन, या कुंजी प्रतिधारण के बिना छद्मनामीकरण — AI सुरक्षा समस्या को हल करते हुए एक अलग समस्या बनाता है: साक्ष्य का spoliation।
मुकदमेबाज़ी, नियामक जांच, या डिस्कवरी दायित्वों के अधीन संगठनों के लिए, अनामीकृत प्रतिनिधित्व से मूल डेटा को पुनर्प्राप्त करने की क्षमता को स्थायी रूप से नष्ट करना Federal और राज्य डिस्कवरी नियमों के तहत spoliation का गठन कर सकता है।
डेटा साझाकरण का पैमाना जो इसे तत्काल बनाता है
77% साप्ताहिक साझाकरण दर दायरे को स्थापित करती है। उद्योगों में कर्मचारी — कानूनी, स्वास्थ्य सेवा, वित्तीय सेवाएं, प्रौद्योगिकी — अपने वर्कफ़्लो के एक नियमित भाग के रूप में AI टूल को कार्य-संबंधी सामग्री सबमिट कर रहे हैं।
उस सामग्री में शामिल हैं:
- ग्राहक संचार और पत्राचार
- अनुबंध मसौदे और बातचीत की शर्तें
- आंतरिक रणनीति चर्चाएं और व्यावसायिक योजना दस्तावेज़
- वित्तीय अनुमान और मॉडलिंग डेटा
- कानूनी शोध ज्ञापन और मामला रणनीति नोट
- रोगी जानकारी और नैदानिक दस्तावेज़ीकरण
- कर्मचारी रिकॉर्ड और HR संचार
जब कोई संगठन अपने AI सुरक्षा नियंत्रण के रूप में स्थायी अनामीकरण लागू करता है, तो सामान्य व्यवसाय के दौरान उस नियंत्रण से गुज़रने वाला प्रत्येक दस्तावेज़ ऐसे तरीकों से बदला जा सकता है जो उसके साक्ष्य मूल्य को नष्ट करते हैं।
GDPR की प्रतिवर्तनीयता आवश्यकता
यूरोपीय संघ का डेटा संरक्षण नियामक ढांचा छद्मनामीकरण के संदर्भ में स्पष्ट रूप से प्रतिवर्तनीयता प्रश्न को संबोधित करता है।
GDPR अनुच्छेद 4(5) छद्मनामीकरण को परिभाषित करता है "व्यक्तिगत डेटा के ऐसे तरीके से प्रसंस्करण के रूप में जिसमें व्यक्तिगत डेटा को अतिरिक्त जानकारी के उपयोग के बिना किसी विशिष्ट डेटा विषय के लिए जिम्मेदार नहीं ठहराया जा सकता, बशर्ते कि ऐसी अतिरिक्त जानकारी अलग रखी जाए और तकनीकी और संगठनात्मक उपायों के अधीन हो जो यह सुनिश्चित करते हैं कि व्यक्तिगत डेटा किसी पहचाने गए या पहचानने योग्य प्राकृतिक व्यक्ति को जिम्मेदार नहीं ठहराया जाता।"
परिभाषा के लिए आवश्यक है कि "अतिरिक्त जानकारी" — वह कुंजी जो पुन: जिम्मेदारी की अनुमति देती है — बनाए रखी जाए। GDPR के तहत छद्मनामीकृत डेटा ऐसा डेटा है जिसे अलग संग्रहीत कुंजियों का उपयोग करके पुनः पहचाना जा सकता है। जिस डेटा को पुनः पहचाना नहीं जा सकता, वह GDPR के तहत छद्मनामीकृत नहीं है — वह अनामीकृत है।
European Data Protection Board के Guidelines 05/2022 छद्मनामीकरण के उपयोग पर पुष्टि करते हैं कि प्रतिवर्तनीयता Regulation के तहत छद्मनामीकरण की एक परिभाषात्मक आवश्यकता है। जो संगठन स्थायी एकतरफ़ा अनामीकरण लागू करते हैं, वे GDPR के परिभाषित करने के अनुसार छद्मनामीकरण लागू नहीं कर रहे — वे अनामीकरण लागू कर रहे हैं।
Federal Rules Spoliation Framework
Civil Procedure के Federal Rules के तहत, मुकदमेबाज़ी के पक्षकारों का दायित्व है कि वे उन दस्तावेज़ों और इलेक्ट्रॉनिक रूप से संग्रहीत जानकारी को संरक्षित करें जो प्रत्याशित या वास्तविक मुकदमेबाज़ी के लिए प्रासंगिक हो सकती है। यह कर्तव्य तब लागू होता है जब मुकदमेबाज़ी उचित रूप से प्रत्याशित होती है — जब मुकदमेबाज़ी दायर होती है तब नहीं।
Rule 37(e) न्यायालयों को उस पक्ष पर प्रतिबंध लगाने का अधिकार देता है जो इलेक्ट्रॉनिक रूप से संग्रहीत जानकारी को संरक्षित करने में विफल रहता है जिसे संरक्षित किया जाना चाहिए था, और विफलता के परिणामस्वरूप किसी अन्य पक्ष को पूर्वाग्रह होता है। प्रतिबंधों में शामिल हो सकते हैं:
- अनुमानित प्रतिकूल अनुमान निर्देश
- साक्ष्य का बहिष्कार
- गंभीर परिस्थितियों में मामला-निपटाने वाले प्रतिबंध
स्थायी अनामीकरण के संदर्भ में spoliation विश्लेषण इस प्रकार काम करता है: यदि कोई संगठन ऐसे AI वर्कफ़्लो का उपयोग करता है जो सामान्य व्यवसाय के दौरान दस्तावेज़ों को स्थायी रूप से अनामीकृत करता है, और वे दस्तावेज़ बाद में मुकदमेबाज़ी के लिए प्रासंगिक हो जाते हैं, तो संगठन ने उन दस्तावेज़ों को ऐसे तरीके से बदल दिया है जो उनकी मूल सामग्री की पुनर्प्राप्ति को रोकता है।
तकनीकी अंतर: प्रतिवर्ती बनाम अपरिवर्तनीय
प्रतिवर्ती और अपरिवर्तनीय अनामीकरण के बीच तकनीकी अंतर वास्तुकला संबंधी है, वृद्धिशील नहीं।
अपरिवर्तनीय अनामीकरण (हैशिंग, स्थायी प्रतिस्थापन, विनाशकारी रिडैक्शन) डेटा को ऐसे तरीके से बदलता है जिसे पूर्ववत नहीं किया जा सकता। ग्राहक नाम का SHA-256 हैशिंग एक निश्चित-लंबाई हैश उत्पन्न करता है जिससे नाम प्राप्त नहीं किया जा सकता।
प्रतिवर्ती छद्मनामीकरण (कुंजी प्रतिधारण के साथ टोकन प्रतिस्थापन, AES-256-GCM एन्क्रिप्शन) डेटा को ऐसे तरीके से बदलता है जिसे अलग संग्रहीत जानकारी का उपयोग करके पूर्ववत किया जा सकता है। एक संरचित टोकन के साथ प्रतिस्थापित ग्राहक नाम को मैपिंग तालिका का उपयोग करके मूल नाम के साथ पुनः संबद्ध किया जा सकता है। AES-256-GCM एन्क्रिप्टेड सामग्री को संबंधित कुंजी का उपयोग करके डिक्रिप्ट किया जा सकता है।
AI सुरक्षा उद्देश्यों के लिए — AI प्रदाताओं तक उपयोग करने योग्य रूप में संवेदनशील डेटा पहुंचने से रोकना — दोनों दृष्टिकोण एक ही लक्ष्य प्राप्त करते हैं।
कानूनी अनुपालन के लिए — डिस्कवरी, नियामक प्रतिक्रिया, या वैध व्यावसायिक उद्देश्यों के लिए मूल सामग्री को पुनर्प्राप्त करने की क्षमता संरक्षित करना — केवल प्रतिवर्ती छद्मनामीकरण संगत है।
अनुपालन आर्किटेक्चर
वह आर्किटेक्चर जो AI सुरक्षा और डिस्कवरी अनुपालन दोनों को संबोधित करता है, प्रतिवर्ती AES-256-GCM छद्मनामीकरण का उपयोग करता है:
- AI टूल को सबमिशन से पहले दस्तावेज़ों को संसाधित किया जाता है
- संवेदनशील इकाइयां — नाम, खाता संख्याएं, पहचानकर्ता, PHI, विशेषाधिकार प्राप्त सामग्री — को संरचित टोकन से बदला जाता है
- टोकन-से-मूल मैपिंग डेटा संवेदनशीलता के लिए उचित पहुंच नियंत्रण के साथ अलग संग्रहीत किया जाता है
- AI प्रसंस्करण टोकनीकृत संस्करण पर होता है — AI मॉडल को कभी भी पुनर्प्राप्त करने योग्य संवेदनशील सामग्री नहीं मिलती
- परिणाम वैध व्यावसायिक उपयोग के लिए संग्रहीत मैपिंग का उपयोग करके डी-टोकनीकृत होते हैं
- मैपिंग डिस्कवरी दायित्व लागू होने पर litigation hold के अधीन है
इस आर्किटेक्चर के तहत, मूल सामग्री कभी नष्ट नहीं होती। AI प्रदाता को इसे उपयोग करने योग्य रूप में कभी नहीं मिलता। टोकन मैपिंग कानूनी रूप से आवश्यक होने पर मूल सामग्री को पुनर्प्राप्त करने की क्षमता को संरक्षित करता है। Spoliation जोखिम समाप्त हो जाता है क्योंकि कोई साक्ष्य नष्ट नहीं होता — केवल अस्थायी रूप से प्रतिवर्ती तरीके से छद्मनामीकृत।
AI सुरक्षा नियंत्रण लागू करने वाले संगठन एक बाइनरी विकल्प का सामना करते हैं: स्थायी रूप से अनामीकृत करें और डिस्कवरी जोखिम बनाएं, या प्रतिवर्ती रूप से छद्मनामीकृत करें और एक साथ सुरक्षा और अनुपालन आवश्यकताओं को पूरा करें।
स्रोत: