एयर-गैप नियम
कुछ नेटवर्क में इंटरनेट नहीं होता। नीति से नहीं — डिज़ाइन से।
SCIF (Sensitive Compartmented Information Facility) एक Faraday-caged कमरा है। कोई वायरलेस सिग्नल अंदर या बाहर नहीं जाता। ITAR (International Traffic in Arms Regulations) कवर की गई तकनीकी सामग्री को गैर-अनुमोदित पार्टियों को भेजना प्रतिबंधित करता है। क्लाउड प्रदाता ITAR-cleared नहीं हैं। इन समूहों के लिए, "क्लाउड SaaS" प्रबंधन के लिए एक जोखिम नहीं है।
इन साइटों के लिए, क्लाउड टूल काम नहीं करते। पूर्ण विराम।
एक टूल जिसे लाइव नेटवर्क लिंक की आवश्यकता है, यहाँ नहीं चल सकता। एक टूल जो लाइसेंस सर्वर को कॉल करता है, ब्लॉक होता है। एक टूल जो डिटेक्शन के लिए क्लाउड API को फ़ाइलें भेजता है, SCIF के अंदर काम नहीं कर सकता। ये एज केस नहीं हैं। ये रक्षा दलों के लिए दैनिक बाधाएँ हैं।
ITAR मामला
एक रक्षा फर्म में एक डेटा वैज्ञानिक के पास ITAR के तहत कार्मिक रिकॉर्ड हैं। उसे फ़ाइलें साझा करने से पहले नाम और ID हटाने होंगे। उसका नेटवर्क एयर-गैप्ड है।
कोई क्लाउड समाधान नहीं है। एकमात्र रास्ता एक ऐसा टूल है जो स्थानीय डिवाइस पर चलता है। इसे अपने मॉडल स्थानीय रूप से संग्रहीत करने होंगे। इसे बिना बाहरी कॉल के साफ आउटपुट उत्पन्न करना होगा।
Tauri 2.0-आधारित Desktop App यही करता है। इंस्टॉलेशन के बाद, रन के दौरान कोई नेटवर्क कॉल नहीं होती। spaCy NER मॉडल और regex पैटर्न सभी स्थानीय CPU पर चलते हैं। उपयोगकर्ता द्वारा निर्यात करने तक आउटपुट डिवाइस पर रहता है।
प्रतिवर्तीयता क्यों मायने रखती है
वर्गीकृत कार्य को अक्सर प्रतिवर्ती स्यूडोनिमाइज़ेशन की आवश्यकता होती है। टीमें वास्तविक नामों को कोड से बदलती हैं। वे रिकॉर्ड को उपयोगी बनाए रखती हैं। वे वास्तविक पहचान की रक्षा करती हैं।
GDPR अनुच्छेद 4(5) स्यूडोनिमाइज़ेशन को एक औपचारिक गोपनीयता उपाय के रूप में परिभाषित करता है। यह जोखिम कम करता है। स्यूडोनिमाइज़्ड रिकॉर्ड कम कानूनी कर्तव्य वहन करते हैं — यदि लुकअप टोकन डेटासेट से अलग संग्रहीत किया जाता है।
IAPP शोध (2024) में पाया गया कि केवल 23% टूल सच्ची प्रतिवर्तीयता का समर्थन करते हैं। अधिकांश एक-तरफ़ा मास्किंग या पूर्ण प्रतिस्थापन करते हैं। एक बार रिकॉर्ड ओवरराइट होने के बाद, वह गायब है।
कुछ सरकारी टीमें अपने काम को compartment द्वारा विभाजित करती हैं। एक टीम को स्यूडोनिमाइज़्ड फ़ाइलें मिलती हैं। वे विश्लेषण करती हैं। दूसरी टीम लुकअप टोकन रखती है। वे केवल तभी रिकॉर्ड को पुनः पहचानती हैं जब कानून इसकी आवश्यकता हो। यह विभाजित डिज़ाइन बहु-टीम वर्गीकृत वर्कफ़्लो के लिए एकमात्र सुरक्षित दृष्टिकोण है।
zero-knowledge मॉडल एक कदम आगे जाता है। लुकअप टोकन क्लाइंट डिवाइस पर बनाया जाता है। इसे कभी नहीं भेजा जाता। यदि विक्रेता को सम्मन किया जाता है, तो वे टोकन नहीं दे सकते। उनके पास कभी था ही नहीं। यह कई वर्गीकृत वातावरण में chain-of-custody नियमों को संतुष्ट करता है।
EDPB टोकन अलगाव
EDPB Guidelines 05/2022 कहती हैं कि स्यूडोनिमाइज़ेशन टोकन अलग रखा जाना चाहिए। यह उसी पार्टी के पास नहीं बैठ सकता जो स्यूडोनिमाइज़्ड रिकॉर्ड रखती है। या इसे ऐसे नियंत्रणों के पीछे बंद होना चाहिए जो उस पार्टी को एक साथ रिकॉर्ड और टोकन दोनों पढ़ने से रोकें।
एक साथ तीन चीजें इस नियम को पूरा करती हैं:
- टोकन क्लाइंट डिवाइस पर बनाया गया — कभी नहीं भेजा गया
- सभी प्रसंस्करण स्थानीय रूप से किया गया — कुछ भी एयर-गैप्ड साइट नहीं छोड़ता
- आउटपुट और टोकन अलग-अलग निर्यात किए गए — दो अलग फ़ाइलें, दो अलग रास्ते
यह डिज़ाइन एक साथ EDPB नियम और एयर-गैप बाधा दोनों को पूरा करता है।
पूरी तस्वीर के लिए, हमारा सुरक्षा अवलोकन दिखाता है कि स्थानीय प्रसंस्करण तृतीय-पक्ष श्रृंखला को कैसे काटता है। हमारा अनुपालन गाइड GDPR ट्रांसफर नियमों को कवर करता है। सेटअप सहायता के लिए हमारा FAQ देखें।
anonym.legal Desktop App सभी PII डिटेक्शन स्थानीय डिवाइस पर चलाता है। इंस्टॉलेशन के बाद कोई इंटरनेट आवश्यक नहीं है। यह Windows, macOS और Linux का समर्थन करता है। बंडल किए गए NLP मॉडल 24 भाषाओं को कवर करते हैं।
2026 के लिए अपडेट किया गया
स्रोत
- EDPB Guidelines 05/2022: स्यूडोनिमाइज़ेशन और टोकन अलगाव — VERIFIED-EXTERNAL
- IAPP 2024: अनामीकरण टूल प्रतिवर्तीयता सर्वेक्षण — FLAGGED
- LocalAI Master: संवेदनशील वातावरण के लिए एयर-गैप्ड AI — VERIFIED-EXTERNAL