ब्लॉग पर वापस जाएँकानूनी तकनीक

GDPR और आपके Excel फ़ाइलें: स्प्रेडशीट एनोनिमाइजेशन...

Excel फ़ार्मूले उन सेल्स को संदर्भित करते हैं जिनमें ग्राहक के नाम होते हैं। पिवट तालिकाएँ संवेदनशील डेटा को कैश करती हैं। 67% सरकारी और रक्षा खरीद...

April 10, 20268 मिनट पढ़ें
Excel anonymizationspreadsheet GDPRpivot table redactioncell-level PII detectionformula preservation

क्यों स्प्रेडशीट दस्तावेज़ नहीं हैं

एक Word दस्तावेज़ एक अनुक्रमिक टेक्स्ट स्ट्रीम है जिसमें फॉर्मेटिंग मेटाडेटा होता है। एक Excel स्प्रेडशीट एक संबंधपरक डेटा संरचना है: सेल्स अन्य सेल्स को संदर्भित करते हैं, फ़ार्मूले सेल रेंज पर काम करते हैं, पिवट तालिकाएँ नामित डेटा रेंज को संचित करती हैं, और मैक्रोज़ स्प्रेडशीट ऑब्जेक्ट मॉडल को पार करते हैं। एक Excel फ़ाइल को एक टेक्स्ट दस्तावेज़ के रूप में मानना जो PII पैटर्न के लिए संसाधित किया जाना है — जिस तरह से अधिकांश दस्तावेज़ संपादन उपकरण स्प्रेडशीट्स के साथ संपर्क करते हैं — स्प्रेडशीट की वास्तविक सामग्री को परिभाषित करने वाले डेटा संबंधों को नजरअंदाज करता है।

एक ग्राहक विश्लेषण स्प्रेडशीट पर विचार करें। कॉलम A में ग्राहक के नाम होते हैं। कॉलम D में एक फ़ार्मूला है: =VLOOKUP(A2, CustomerTable, 5, FALSE) — एक लुकअप जो ग्राहक के नाम के आधार पर उनके खाते का बैलेंस लौटाता है। यदि एनोनिमाइजेशन उपकरण कॉलम A में नाम को बदलता है लेकिन फ़ार्मूला संदर्भ या लुकअप तालिका को अपडेट नहीं करता है, तो फ़ार्मूला मूल नाम के लिए वास्तविक खाता बैलेंस लौटाता रहता है। "एनोनिमाइज्ड" दस्तावेज़ अभी भी डेटा संबंध के माध्यम से मूल ग्राहक पहचान को उजागर करता है।

यह एक काल्पनिक किनारे का मामला नहीं है। एंटरप्राइज Excel फ़ाइलें डेटा संबंधों के चारों ओर बनाई जाती हैं। व्यक्तिगत सेल मानों को समझे बिना गुमनाम रूप से बदलना ऐसे दस्तावेज़ उत्पन्न करता है जो एनोनिमाइज्ड प्रतीत होते हैं लेकिन फ़ार्मूला संदर्भ, पिवट तालिका कैश, और क्रॉस-शीट लुकअप के माध्यम से मूल डेटा को बनाए रखते हैं।

GDPR तृतीय-पक्ष साझाकरण आवश्यकता

GDPR अनुच्छेद 28 प्रोसेसर के साथ डेटा साझा करने को नियंत्रित करता है: संगठन जो व्यक्तिगत डेटा को बाहरी पक्षों (सलाहकारों, विश्लेषण विक्रेताओं, ऑडिटर्स) के साथ साझा करते हैं, उन्हें उचित तकनीकी सुरक्षा सुनिश्चित करनी चाहिए। व्यावहारिक प्रश्न: जब 50,000 ग्राहक रिकॉर्ड वाला Excel डेटा सेट एक बाहरी विश्लेषण विक्रेता के साथ साझा किया जाता है, तो उचित सुरक्षा क्या है?

PDF निर्यात फ़ार्मूलों को हटा देता है और एक स्नैपशॉट उत्पन्न करता है — लेकिन बड़े Excel फ़ाइलों के PDF निर्यात अक्सर जटिल फॉर्मेटिंग को भ्रष्ट करते हैं और विश्लेषणात्मक उपयोग के लिए उपयुक्त नहीं होते हैं। CSV में रूपांतरण फ़ार्मूलों, पिवट तालिकाओं, और अधिकांश विश्लेषणात्मक संरचना को हटा देता है। कोई भी विकल्प बाहरी विक्रेता को उनके विश्लेषणात्मक उद्देश्य के लिए उपयोगी डेटा सेट नहीं देता है।

मूल Excel प्रारूप में सेल-स्तरीय एनोनिमाइजेशन — पहचान करने वाले मानों को बदलना जबकि विश्लेषणात्मक संरचना को बनाए रखना — एकमात्र दृष्टिकोण है जो GDPR सुरक्षा आवश्यकता और व्यावसायिक उपयोगिता आवश्यकता को एक साथ संतुष्ट करता है।

रक्षा स्प्रेडशीट्स के लिए एयर-गैप्ड प्रोसेसिंग

67% सरकारी और रक्षा खरीद RFPs एयर-गैप्ड वातावरण की आवश्यकताओं का उल्लेख करते हैं (DISA 2024)। रक्षा ठेकेदार जो Excel प्रारूप में व्यक्तिगत डेटा, लॉजिस्टिक्स जानकारी, या खरीद रिकॉर्ड के साथ काम कर रहे हैं, वे क्लाउड-आधारित एनोनिमाइजेशन उपकरणों का उपयोग नहीं कर सकते हैं, क्योंकि यह क्लाउड-आधारित दस्तावेज़ प्रोसेसिंग को प्रतिबंधित करने वाले कारणों के समान हैं: डेटा नियंत्रित नेटवर्क से बाहर नहीं जा सकता।

Excel-विशिष्ट एनोनिमाइजेशन क्षमता और केवल स्थानीय प्रोसेसिंग का संयोजन सरकारी अनुबंध अनुपालन के लिए आवश्यक तकनीकी प्रोफ़ाइल बनाता है। डेस्कटॉप ऐप Excel फ़ाइलों को स्थानीय रूप से प्रोसेस करता है बिना प्रोसेसिंग के दौरान नेटवर्क कॉल के; एनोनिमाइजेशन परिणाम कभी भी एयर-गैप्ड वातावरण से बाहर नहीं जाते; प्रोसेस की गई फ़ाइलें नियंत्रित नेटवर्क के भीतर आंतरिक साझाकरण के लिए उपलब्ध होती हैं।

सेल-स्तरीय बुद्धिमत्ता

प्रभावी Excel एनोनिमाइजेशन एक साथ तीन स्तरों पर काम करता है:

मान-स्तर: व्यक्तिगत सेल्स में PII मानों का पता लगाना और बदलना। ग्राहक के नाम, ईमेल पते, फोन नंबर, और राष्ट्रीय ID नंबर को दस्तावेज़ प्रोसेसिंग के लिए उपयोग किए जाने वाले समान हाइब्रिड डिटेक्शन इंजन के माध्यम से पहचाना जाता है।

फ़ार्मूला-स्तर: उन सेल्स की पहचान करना जिनके फ़ार्मूले PII-समावेशी सेल्स को संदर्भित करते हैं, और उन संदर्भों को एनोनिमाइज्ड मानों की ओर इंगित करने के लिए अपडेट करना या फ़ार्मूले को इसके गणना किए गए परिणाम के साथ बदलना ताकि फ़ार्मूला-आधारित PII एक्सपोजर को रोका जा सके।

संरचना-स्तर: पिवट तालिका डेटा कैश को साफ करना, छिपी हुई पंक्तियों और कॉलम को प्रोसेस करना, और VBA मैक्रो कोड को संभालना जो विशिष्ट सेल पते या मानों को संदर्भित करता है।

स्रोत:

क्या आप अपने डेटा की सुरक्षा के लिए तैयार हैं?

48 भाषाओं में 285+ संस्थाओं के प्रकारों के साथ PII अनामकरण शुरू करें।