एक अनुपालन जोखिम हल करके दूसरा बनाने की समस्या

जो संगठन AI टूल के डेटा लीकेज जोखिम को समझ चुके हैं, वे अक्सर एक तार्किक-दिखने वाला समाधान लागू करते हैं: AI प्रदाताओं तक पहुंचने से पहले संवेदनशील सामग्री को अनामीकृत करना, स्थायी या एकतरफ़ा अनामीकरण का उपयोग करके जिसे उलटा नहीं किया जा सकता।

सुरक्षा पक्ष पर तर्क सही है। Cyberhaven के Q4 2025 विश्लेषण ने पाया कि ChatGPT को सबमिट की गई 34.8% सामग्री में संवेदनशील जानकारी होती है। Ponemon Institute के 2024 शोध ने स्थापित किया कि AI डेटा लीक की औसत लागत $2.1 मिलियन है। eSecurity Planet और Cyberhaven के शोध ने पाया कि 77% कर्मचारी साप्ताहिक आधार पर AI टूल के साथ संवेदनशील डेटा साझा करते हैं। जोखिम वास्तविक, बार-बार और महंगा है।

लेकिन स्थायी अनामीकरण — अपरिवर्तनीय एकतरफ़ा हैशिंग, विनाशकारी रिडैक्शन, या कुंजी प्रतिधारण के बिना छद्मनामीकरण — AI सुरक्षा समस्या को हल करते हुए एक अलग समस्या बनाता है: साक्ष्य का spoliation।

मुकदमेबाज़ी, नियामक जांच, या डिस्कवरी दायित्वों के अधीन संगठनों के लिए, अनामीकृत प्रतिनिधित्व से मूल डेटा को पुनर्प्राप्त करने की क्षमता को स्थायी रूप से नष्ट करना Federal और राज्य डिस्कवरी नियमों के तहत spoliation का गठन कर सकता है।

डेटा साझाकरण का पैमाना जो इसे तत्काल बनाता है

77% साप्ताहिक साझाकरण दर दायरे को स्थापित करती है। उद्योगों में कर्मचारी — कानूनी, स्वास्थ्य सेवा, वित्तीय सेवाएं, प्रौद्योगिकी — अपने वर्कफ़्लो के एक नियमित भाग के रूप में AI टूल को कार्य-संबंधी सामग्री सबमिट कर रहे हैं।

उस सामग्री में शामिल हैं:

ग्राहक संचार और पत्राचार
अनुबंध मसौदे और बातचीत की शर्तें
आंतरिक रणनीति चर्चाएं और व्यावसायिक योजना दस्तावेज़
वित्तीय अनुमान और मॉडलिंग डेटा
कानूनी शोध ज्ञापन और मामला रणनीति नोट
रोगी जानकारी और नैदानिक दस्तावेज़ीकरण
कर्मचारी रिकॉर्ड और HR संचार

जब कोई संगठन अपने AI सुरक्षा नियंत्रण के रूप में स्थायी अनामीकरण लागू करता है, तो सामान्य व्यवसाय के दौरान उस नियंत्रण से गुज़रने वाला प्रत्येक दस्तावेज़ ऐसे तरीकों से बदला जा सकता है जो उसके साक्ष्य मूल्य को नष्ट करते हैं।

यूरोपीय संघ का डेटा संरक्षण नियामक ढांचा छद्मनामीकरण के संदर्भ में स्पष्ट रूप से प्रतिवर्तनीयता प्रश्न को संबोधित करता है।

GDPR अनुच्छेद 4(5) छद्मनामीकरण को परिभाषित करता है "व्यक्तिगत डेटा के ऐसे तरीके से प्रसंस्करण के रूप में जिसमें व्यक्तिगत डेटा को अतिरिक्त जानकारी के उपयोग के बिना किसी विशिष्ट डेटा विषय के लिए जिम्मेदार नहीं ठहराया जा सकता, बशर्ते कि ऐसी अतिरिक्त जानकारी अलग रखी जाए और तकनीकी और संगठनात्मक उपायों के अधीन हो जो यह सुनिश्चित करते हैं कि व्यक्तिगत डेटा किसी पहचाने गए या पहचानने योग्य प्राकृतिक व्यक्ति को जिम्मेदार नहीं ठहराया जाता।"

परिभाषा के लिए आवश्यक है कि "अतिरिक्त जानकारी" — वह कुंजी जो पुन: जिम्मेदारी की अनुमति देती है — बनाए रखी जाए। GDPR के तहत छद्मनामीकृत डेटा ऐसा डेटा है जिसे अलग संग्रहीत कुंजियों का उपयोग करके पुनः पहचाना जा सकता है। जिस डेटा को पुनः पहचाना नहीं जा सकता, वह GDPR के तहत छद्मनामीकृत नहीं है — वह अनामीकृत है।

European Data Protection Board के Guidelines 05/2022 छद्मनामीकरण के उपयोग पर पुष्टि करते हैं कि प्रतिवर्तनीयता Regulation के तहत छद्मनामीकरण की एक परिभाषात्मक आवश्यकता है। जो संगठन स्थायी एकतरफ़ा अनामीकरण लागू करते हैं, वे GDPR के परिभाषित करने के अनुसार छद्मनामीकरण लागू नहीं कर रहे — वे अनामीकरण लागू कर रहे हैं।

Federal Rules Spoliation Framework

Civil Procedure के Federal Rules के तहत, मुकदमेबाज़ी के पक्षकारों का दायित्व है कि वे उन दस्तावेज़ों और इलेक्ट्रॉनिक रूप से संग्रहीत जानकारी को संरक्षित करें जो प्रत्याशित या वास्तविक मुकदमेबाज़ी के लिए प्रासंगिक हो सकती है। यह कर्तव्य तब लागू होता है जब मुकदमेबाज़ी उचित रूप से प्रत्याशित होती है — जब मुकदमेबाज़ी दायर होती है तब नहीं।

Rule 37(e) न्यायालयों को उस पक्ष पर प्रतिबंध लगाने का अधिकार देता है जो इलेक्ट्रॉनिक रूप से संग्रहीत जानकारी को संरक्षित करने में विफल रहता है जिसे संरक्षित किया जाना चाहिए था, और विफलता के परिणामस्वरूप किसी अन्य पक्ष को पूर्वाग्रह होता है। प्रतिबंधों में शामिल हो सकते हैं:

अनुमानित प्रतिकूल अनुमान निर्देश
साक्ष्य का बहिष्कार
गंभीर परिस्थितियों में मामला-निपटाने वाले प्रतिबंध

स्थायी अनामीकरण के संदर्भ में spoliation विश्लेषण इस प्रकार काम करता है: यदि कोई संगठन ऐसे AI वर्कफ़्लो का उपयोग करता है जो सामान्य व्यवसाय के दौरान दस्तावेज़ों को स्थायी रूप से अनामीकृत करता है, और वे दस्तावेज़ बाद में मुकदमेबाज़ी के लिए प्रासंगिक हो जाते हैं, तो संगठन ने उन दस्तावेज़ों को ऐसे तरीके से बदल दिया है जो उनकी मूल सामग्री की पुनर्प्राप्ति को रोकता है।

तकनीकी अंतर: प्रतिवर्ती बनाम अपरिवर्तनीय

प्रतिवर्ती और अपरिवर्तनीय अनामीकरण के बीच तकनीकी अंतर वास्तुकला संबंधी है, वृद्धिशील नहीं।

अपरिवर्तनीय अनामीकरण (हैशिंग, स्थायी प्रतिस्थापन, विनाशकारी रिडैक्शन) डेटा को ऐसे तरीके से बदलता है जिसे पूर्ववत नहीं किया जा सकता। ग्राहक नाम का SHA-256 हैशिंग एक निश्चित-लंबाई हैश उत्पन्न करता है जिससे नाम प्राप्त नहीं किया जा सकता।

प्रतिवर्ती छद्मनामीकरण (कुंजी प्रतिधारण के साथ टोकन प्रतिस्थापन, AES-256-GCM एन्क्रिप्शन) डेटा को ऐसे तरीके से बदलता है जिसे अलग संग्रहीत जानकारी का उपयोग करके पूर्ववत किया जा सकता है। एक संरचित टोकन के साथ प्रतिस्थापित ग्राहक नाम को मैपिंग तालिका का उपयोग करके मूल नाम के साथ पुनः संबद्ध किया जा सकता है। AES-256-GCM एन्क्रिप्टेड सामग्री को संबंधित कुंजी का उपयोग करके डिक्रिप्ट किया जा सकता है।

AI सुरक्षा उद्देश्यों के लिए — AI प्रदाताओं तक उपयोग करने योग्य रूप में संवेदनशील डेटा पहुंचने से रोकना — दोनों दृष्टिकोण एक ही लक्ष्य प्राप्त करते हैं।

कानूनी अनुपालन के लिए — डिस्कवरी, नियामक प्रतिक्रिया, या वैध व्यावसायिक उद्देश्यों के लिए मूल सामग्री को पुनर्प्राप्त करने की क्षमता संरक्षित करना — केवल प्रतिवर्ती छद्मनामीकरण संगत है।

अनुपालन आर्किटेक्चर

वह आर्किटेक्चर जो AI सुरक्षा और डिस्कवरी अनुपालन दोनों को संबोधित करता है, प्रतिवर्ती AES-256-GCM छद्मनामीकरण का उपयोग करता है:

AI टूल को सबमिशन से पहले दस्तावेज़ों को संसाधित किया जाता है
संवेदनशील इकाइयां — नाम, खाता संख्याएं, पहचानकर्ता, PHI, विशेषाधिकार प्राप्त सामग्री — को संरचित टोकन से बदला जाता है
टोकन-से-मूल मैपिंग डेटा संवेदनशीलता के लिए उचित पहुंच नियंत्रण के साथ अलग संग्रहीत किया जाता है
AI प्रसंस्करण टोकनीकृत संस्करण पर होता है — AI मॉडल को कभी भी पुनर्प्राप्त करने योग्य संवेदनशील सामग्री नहीं मिलती
परिणाम वैध व्यावसायिक उपयोग के लिए संग्रहीत मैपिंग का उपयोग करके डी-टोकनीकृत होते हैं
मैपिंग डिस्कवरी दायित्व लागू होने पर litigation hold के अधीन है

इस आर्किटेक्चर के तहत, मूल सामग्री कभी नष्ट नहीं होती। AI प्रदाता को इसे उपयोग करने योग्य रूप में कभी नहीं मिलता। टोकन मैपिंग कानूनी रूप से आवश्यक होने पर मूल सामग्री को पुनर्प्राप्त करने की क्षमता को संरक्षित करता है। Spoliation जोखिम समाप्त हो जाता है क्योंकि कोई साक्ष्य नष्ट नहीं होता — केवल अस्थायी रूप से प्रतिवर्ती तरीके से छद्मनामीकृत।

AI सुरक्षा नियंत्रण लागू करने वाले संगठन एक बाइनरी विकल्प का सामना करते हैं: स्थायी रूप से अनामीकृत करें और डिस्कवरी जोखिम बनाएं, या प्रतिवर्ती रूप से छद्मनामीकृत करें और एक साथ सुरक्षा और अनुपालन आवश्यकताओं को पूरा करें।

स्रोत:

क्या आप अपने डेटा की सुरक्षा के लिए तैयार हैं?

48 भाषाओं में 285+ संस्थाओं के प्रकारों के साथ PII अनामकरण शुरू करें।

फ्री ट्रायल शुरू करें विशेषताएँ देखें

स्थायी अनामीकरण: Spoliation जोखिम

एक अनुपालन जोखिम हल करके दूसरा बनाने की समस्या

डेटा साझाकरण का पैमाना जो इसे तत्काल बनाता है

Federal Rules Spoliation Framework

तकनीकी अंतर: प्रतिवर्ती बनाम अपरिवर्तनीय

अनुपालन आर्किटेक्चर

संबंधित लेख

Legal PII: Privilege Detection

PII Detection Cuts E-Discovery Costs

Anonymous HR Surveys with Reversible PII

क्या आप अपने डेटा की सुरक्षा के लिए तैयार हैं?

स्थायी अनामीकरण: Spoliation जोखिम

एक अनुपालन जोखिम हल करके दूसरा बनाने की समस्या

डेटा साझाकरण का पैमाना जो इसे तत्काल बनाता है

GDPR की प्रतिवर्तनीयता आवश्यकता

Federal Rules Spoliation Framework

तकनीकी अंतर: प्रतिवर्ती बनाम अपरिवर्तनीय

अनुपालन आर्किटेक्चर

संबंधित लेख

Legal PII: Privilege Detection

PII Detection Cuts E-Discovery Costs

Anonymous HR Surveys with Reversible PII

क्या आप अपने डेटा की सुरक्षा के लिए तैयार हैं?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow