ब्लॉग पर वापस जाएँकानूनी तकनीक

Excel और GDPR: स्प्रेडशीट में छिपे डेटा एक्सपोजर...

GDPR एक्सेस के अधिकार के अनुरोध 2021 से 2024 तक 180% बढ़ गए हैं (EDPB)। औसत DSAR प्रोसेसिंग मैन्युअल रूप से 12 घंटे लेती है। 100,000-रो वाले...

April 7, 20268 मिनट पढ़ें
Excel GDPR anonymizationspreadsheet redactionDSAR processingEDPB right of accessHR data compliance

स्प्रेडशीट अनुपालन अंतर

PDF रेडैक्शन उपकरण Excel स्प्रेडशीट को संभाल नहीं सकते। यह एकल तथ्य उन संगठनों के लिए एक प्रणालीगत अनुपालन अंतर पैदा करता है जो व्यक्तिगत डेटा को Excel प्रारूप में संग्रहीत करते हैं — जिसका अर्थ है कि उद्यम वातावरण में लगभग हर HR विभाग, वित्तीय टीम, और संचालन विभाग।

EDPB की वार्षिक रिपोर्ट डेटा दिखाती है कि GDPR एक्सेस के अधिकार के अनुरोध 2021 से 2024 तक 180% बढ़ गए हैं। DSAR प्राप्त करने वाले संगठनों को अनुरोधकर्ता का व्यक्तिगत डेटा एक पोर्टेबल प्रारूप में प्रदान करना चाहिए जबकि यह सुनिश्चित करना चाहिए कि उसी डेटा सेट में शामिल तीसरे पक्ष के डेटा को उचित रूप से सुरक्षित रखा गया है। Excel में संग्रहीत कर्मचारी डेटा सेट के लिए, मानक प्रतिक्रिया — विशिष्ट पंक्तियों का निर्यात — अभी भी उसी फ़ाइल में अन्य कर्मचारियों के डेटा को उजागर करती है। उचित DSAR अनुपालन के लिए गैर-अनुरोधकर्ता डेटा का प्रति-रिकॉर्ड एनोनिमाइजेशन आवश्यक है।

औसत DSAR को मैन्युअल रूप से प्रोसेस करने में 12 घंटे लगते हैं। एक संगठन जो प्रति माह 200 DSAR प्राप्त करता है — एक मध्यम आकार की कंपनी के लिए एक मामूली मात्रा — यह अनुपालन ओवरहेड में प्रति माह 2,400 स्टाफ-घंटे का प्रतिनिधित्व करता है। मैन्युअल दृष्टिकोण EDPB डेटा द्वारा इस दशक के शेष भाग के लिए अनुरोधों की मात्रा के लिए स्केल नहीं करता है।

Excel एनोनिमाइजेशन वास्तव में क्या आवश्यक है

स्प्रेडशीट एनोनिमाइजेशन चुनौतियों का सामना करता है जिन्हें PDF रेडैक्शन उपकरण संभालने के लिए डिज़ाइन नहीं किए गए हैं।

छिपी हुई पंक्तियाँ और कॉलम: Excel फ़ाइलों में सामान्यतः छिपी हुई पंक्तियाँ (ड्राफ्ट डेटा, फ़िल्टर की गई रिकॉर्ड) और छिपे हुए कॉलम (अंतरिम गणनाएँ, परिवर्तन से पहले के मूल मान) होते हैं। एक रेडैक्शन उपकरण जो केवल दृश्यमान कोशिकाओं को प्रोसेस करता है, छिपी हुई PII को बरकरार रखता है। एक अनुपालन-ग्रेड Excel एनोनिमाइज़र को सभी शीट्स, जिसमें छिपी हुई भी शामिल हैं, को प्रोसेस करना चाहिए।

एंबेडेड फॉर्मूले: कोशिकाएँ जो अन्य कोशिकाओं में PII को संदर्भित करने वाले फॉर्मूलों को शामिल करती हैं, व्युत्पन्न मान प्रदर्शित कर सकती हैं जबकि फॉर्मूला स्वयं मूल डेटा को संदर्भित करता है। प्रदर्शन मान को एनोनिमाइज करना बिना फॉर्मूला संदर्भ को अपडेट किए मूल PII को किसी भी व्यक्ति के लिए उपलब्ध छोड़ देता है जो फॉर्मूला की जांच करता है।

पिवट टेबल कैश: Excel पिवट टेबल उस अंतर्निहित डेटा को कैश करते हैं जिसका उपयोग पिवट उत्पन्न करने के लिए किया जाता है। स्रोत डेटा शीट को एनोनिमाइज करना स्वचालित रूप से पिवट कैश को साफ नहीं करता है। एक प्रतिकूल उपयोगकर्ता जो "एनोनिमाइज्ड" Excel फ़ाइल प्राप्त करता है, मूल डेटा को पुनर्प्राप्त करने के लिए पिवट कैश की जांच कर सकता है।

क्रॉस-शीट संदर्भ: उद्यम Excel फ़ाइलों में नियमित रूप से क्रॉस-शीट सेल संदर्भ होते हैं। एक कर्मचारी का नाम शीट 1 पर दिखाई दे सकता है और शीट 3 पर गणनाओं में संदर्भित किया जा सकता है। शीट 1 को एनोनिमाइज करना बिना शीट 3 संदर्भों को अपडेट किए एनोनिमाइज्ड डेटा के संदर्भ को छोड़ देता है जो फॉर्मूला निरीक्षण के माध्यम से मूल मान को प्रकट कर सकता है।

HR विभाग उपयोग मामला

एक जर्मन विनिर्माण कंपनी को एक बेंचमार्किंग प्रोजेक्ट के लिए एक बाहरी मुआवजा सलाहकार के साथ 50,000 कर्मचारी रिकॉर्ड साझा करने होंगे। GDPR अनुच्छेद 28 के अनुसार, एक प्रोसेसर (बाहरी सलाहकार) के साथ व्यक्तिगत डेटा साझा करने में उचित तकनीकी नियंत्रण शामिल होना चाहिए। Excel फ़ाइल में 37 कॉलम होते हैं जिनमें नाम, व्यक्तिगत ईमेल पते, घर के पते, वेतन, प्रदर्शन रेटिंग, और चिकित्सा अवकाश रिकॉर्ड शामिल हैं।

37 कॉलम में 50,000 पंक्तियों का मैन्युअल एनोनिमाइजेशन किसी भी अनुपालन समय सीमा में संभव नहीं है। Word और Excel ऐड-इन स्प्रेडशीट को मूल रूप से प्रोसेस करता है — Microsoft Excel के भीतर, निर्यात या रूपांतरण के बिना। सेल-स्तरीय PII पहचान सभी दृश्यमान और छिपी हुई शीट्स में व्यक्तिगत डेटा की पहचान करती है। नामों को उपनामों से बदल दिया जाता है; पते प्रकार-उपयुक्त प्लेसहोल्डर्स से; वेतन बनाए रखा जाता है (PII नहीं) जबकि संबंधित व्यक्तिगत पहचानकर्ता हटा दिए जाते हैं। एनोनिमाइजेशन प्रक्रिया 50,000 पंक्तियों को मिनटों में पूरी करती है न कि दिनों में।

प्रति-इकाई कॉन्फ़िगरेशन विभिन्न डेटा प्रकारों के लिए विभिन्न उपचार की अनुमति देता है: नामों को लगातार उपनामों से बदला जाता है (विभिन्न कोशिकाओं में समान नाम को समान उपनाम मिलता है, विश्लेषणात्मक उपयोगिता को बनाए रखते हुए); SSNs को मास्क किए गए स्ट्रिंग्स से बदला जाता है; पते केवल शहर के अनुमान से बदले जाते हैं; व्यक्तिगत ईमेल पते भूमिका-आधारित प्लेसहोल्डर्स से बदले जाते हैं।

स्रोत:

क्या आप अपने डेटा की सुरक्षा के लिए तैयार हैं?

48 भाषाओं में 285+ संस्थाओं के प्रकारों के साथ PII अनामकरण शुरू करें।