स्प्रेडशीट दस्तावेज़ नहीं हैं
Word फ़ाइल एक टेक्स्ट स्ट्रीम है। Excel फ़ाइल कुछ और है। सेल दूसरे सेल को इंगित करते हैं। फॉर्मूले रेंज पर चलते हैं। पिवट टेबल नामांकित डेटा को समूहीकृत करते हैं। मैक्रो पूरे वर्कबुक में चलते हैं। अधिकांश रिडेक्शन टूल Excel को टेक्स्ट दस्तावेज़ की तरह मानते हैं। यह गलत मॉडल है।
यहाँ एक सरल उदाहरण है। कॉलम A में ग्राहक नाम हैं। कॉलम D में यह फॉर्मूला है: =VLOOKUP(A2, CustomerTable, 5, FALSE)। यह फॉर्मूला नाम से खाता शेष देखता है। आप कॉलम A में नाम बदलते हैं। आप फॉर्मूला या लुकअप टेबल अपडेट नहीं करते। फॉर्मूला अभी भी मूल नाम के लिए वास्तविक शेष लौटाता है। फ़ाइल साफ दिखती है। वह है नहीं।
यह उद्यम Excel फ़ाइलों में सामान्य है। डेटा संबंधों में रहता है — न कि केवल सेल में। उन संबंधों को ट्रेस किए बिना सेल मान बदलने से PII उजागर रहती है।
GDPR अनुच्छेद 28 और बाहरी साझाकरण
GDPR अनुच्छेद 28 प्रोसेसर के साथ डेटा साझाकरण को कवर करता है। यदि आप किसी सलाहकार, विक्रेता या ऑडिटर को व्यक्तिगत डेटा भेजते हैं, तो आपको तकनीकी सुरक्षा उपाय लागू करने होंगे।
मान लीजिए आपको एनालिटिक्स विक्रेता के साथ 50,000-पंक्ति की ग्राहक फ़ाइल साझा करनी है। PDF निर्यात फॉर्मूले हटा देता है। यह जटिल स्वरूपण वाली बड़ी फ़ाइलें भी तोड़ देता है। CSV भी फॉर्मूले और पिवट टेबल हटा देता है। न तो विक्रेता को उपयोगी डेटासेट देता है।
एकमात्र विकल्प जो काम करता है: मूल Excel प्रारूप के भीतर अनामीकरण। पहचान करने वाले मान बदलें। संरचना रखें। विक्रेता को एक काम करने वाली फ़ाइल मिलती है। आप GDPR सुरक्षा आवश्यकता पूरी करते हैं।
एयर-गैप्ड वातावरण
67% सरकारी और रक्षा खरीद RFP एयर-गैप्ड वातावरण आवश्यकताओं का उल्लेख करते हैं (DISA 2024)। रक्षा ठेकेदार Excel में कार्मिक डेटा, लॉजिस्टिक्स रिकॉर्ड और खरीद फ़ाइलें संभालते हैं। वे क्लाउड टूल का उपयोग नहीं कर सकते। डेटा नियंत्रित नेटवर्क नहीं छोड़ सकता।
Desktop App यह हल करता है। यह स्थानीय मशीन पर Excel फ़ाइलें प्रसंस्कृत करता है। प्रसंस्करण के दौरान कोई नेटवर्क कॉल नहीं होती। आउटपुट फ़ाइल एयर-गैप्ड वातावरण कभी नहीं छोड़ती। आंतरिक टीमें नियंत्रित नेटवर्क के भीतर साफ फ़ाइलें साझा कर सकती हैं।
यह सरकारी अनुबंध अनुपालन के लिए आवश्यक तकनीकी प्रोफ़ाइल को पूरा करता है।
सेल इंटेलिजेंस के तीन स्तर
अच्छा Excel अनामीकरण एक साथ तीन स्तरों पर काम करता है।
मान स्तर: व्यक्तिगत सेल में PII ढूंढें और बदलें। नाम, ईमेल, फ़ोन नंबर और राष्ट्रीय ID दस्तावेज़ प्रसंस्करण के समान डिटेक्शन इंजन का उपयोग करके फ़्लैग किए जाते हैं।
फॉर्मूला स्तर: उन सेल ढूंढें जिनके फॉर्मूले PII सेल को संदर्भित करते हैं। उन संदर्भों को अनामीकृत मानों की ओर इंगित करने के लिए अपडेट करें। या फॉर्मूला-आधारित PII एक्सपोज़र को रोकने के लिए फॉर्मूले को उसके परिणाम से बदलें।
संरचना स्तर: पिवट टेबल डेटा कैश साफ करें। छिपी हुई पंक्तियों और कॉलम को प्रसंस्कृत करें। VBA मैक्रो कोड को संभालें जो विशिष्ट सेल पते या मान उपयोग करता है।
तीनों स्तरों को एक साथ चलना होगा। फॉर्मूले ठीक किए बिना मान ठीक करने से PII बनी रहती है। कैश साफ किए बिना फॉर्मूले ठीक करने से भी यही होता है।
यह चुनौती हर फ़ाइल प्रारूप में फैली है। व्यापक दृष्टिकोण के लिए PII डिटेक्शन पर प्रारूप विखंडन का प्रभाव देखें।
API स्तर पर संरचित डेटा के साथ काम करने वाली टीमों के लिए, वास्तविक समय API में GDPR डेटा न्यूनीकरण देखें।
यदि आपकी टीम बड़े DSAR निर्यात चलाती है, तो बड़े पैमाने पर GDPR DSAR बैच प्रसंस्करण देखें।