স্প্রেডশিট নথি নয়
Word ফাইল হলো একটি টেক্সট স্ট্রিম। Excel ফাইল অন্যরকম। সেলগুলি অন্য সেল নির্দেশ করে। ফর্মুলা রেঞ্জে চলে। পিভট টেবিল নামযুক্ত ডেটা গোষ্ঠীবদ্ধ করে। ম্যাক্রো পুরো ওয়ার্কবুক জুড়ে চলে। বেশিরভাগ রিড্যাকশন সরঞ্জাম Excel-কে টেক্সট নথির মতো ব্যবহার করে। এটি ভুল মডেল।
এখানে একটি সহজ উদাহরণ। কলাম A-তে গ্রাহকের নাম আছে। কলাম D-তে এই ফর্মুলা আছে: =VLOOKUP(A2, CustomerTable, 5, FALSE)। এই ফর্মুলা নাম দিয়ে অ্যাকাউন্ট ব্যালেন্স খোঁজে। আপনি কলাম A-র নাম প্রতিস্থাপন করেন। ফর্মুলা বা লুকআপ টেবিল আপডেট করেন না। ফর্মুলা তখনও আসল নামের জন্য আসল ব্যালেন্স ফেরত দেয়। ফাইলটি পরিষ্কার দেখায়। কিন্তু তা নয়।
এন্টারপ্রাইজ Excel ফাইলে এটি সাধারণ। ডেটা সম্পর্কের মধ্যে থাকে — শুধু সেলে নয়। সেই সম্পর্ক ট্রেস না করে সেল ভ্যালু প্রতিস্থাপন করলে PII উন্মুক্ত থাকে।
GDPR আর্টিকেল ২৮ এবং বাহ্যিক শেয়ারিং
GDPR আর্টিকেল ২৮ প্রসেসরদের সাথে ডেটা শেয়ারিং কভার করে। যদি আপনি কোনো পরামর্শদাতা, বিক্রেতা বা অডিটরের কাছে ব্যক্তিগত ডেটা পাঠান, আপনার প্রযুক্তিগত সুরক্ষা প্রয়োজন।
ধরুন আপনাকে একটি অ্যানালিটিক্স বিক্রেতার সাথে ৫০,০০০-সারির গ্রাহক ফাইল শেয়ার করতে হবে। PDF এক্সপোর্ট ফর্মুলা সরিয়ে দেয়। এটি জটিল ফরম্যাটিং সহ বড় ফাইলও ভেঙে দেয়। CSV ফর্মুলা এবং পিভট টেবিলও সরিয়ে দেয়। কোনোটিই বিক্রেতাকে ব্যবহারযোগ্য ডেটাসেট দেয় না।
কাজ করে একমাত্র বিকল্প: নেটিভ Excel ফরম্যাটের মধ্যেই অ্যানোনিমাইজ করা। পরিচয়মূলক মান প্রতিস্থাপন করুন। কাঠামো রাখুন। বিক্রেতা কার্যকর ফাইল পায়। আপনি GDPR সুরক্ষার প্রয়োজনীয়তা পূরণ করেন।
এয়ার-গ্যাপড পরিবেশ
সরকার ও প্রতিরক্ষা সংগ্রহের ৬৭% RFP এয়ার-গ্যাপড পরিবেশের প্রয়োজনীয়তা উল্লেখ করে (DISA 2024)। প্রতিরক্ষা ঠিকাদাররা Excel-এ কর্মী ডেটা, লজিস্টিক্স রেকর্ড এবং সংগ্রহ ফাইল পরিচালনা করে। তারা ক্লাউড সরঞ্জাম ব্যবহার করতে পারে না। ডেটা নিয়ন্ত্রিত নেটওয়ার্ক ছেড়ে যেতে পারে না।
Desktop App এটি সমাধান করে। এটি স্থানীয় মেশিনে Excel ফাইল প্রক্রিয়া করে। প্রক্রিয়াকরণের সময় কোনো নেটওয়ার্ক কল হয় না। আউটপুট ফাইল কখনো এয়ার-গ্যাপড পরিবেশ ছেড়ে যায় না। অভ্যন্তরীণ দলগুলি নিয়ন্ত্রিত নেটওয়ার্কের মধ্যে পরিষ্কার ফাইল শেয়ার করতে পারে।
এটি সরকারি চুক্তি কমপ্লায়েন্সের জন্য প্রয়োজনীয় প্রযুক্তিগত প্রোফাইল পূরণ করে।
সেল ইন্টেলিজেন্সের তিনটি স্তর
ভালো Excel অ্যানোনিমাইজেশন একসাথে তিনটি স্তরে কাজ করে।
মান স্তর: পৃথক সেলে PII খুঁজে বের করে প্রতিস্থাপন করুন। নাম, ইমেল, ফোন নম্বর এবং জাতীয় আইডি নথি প্রক্রিয়াকরণের মতো একই ডিটেকশন ইঞ্জিন ব্যবহার করে ফ্ল্যাগ করা হয়।
ফর্মুলা স্তর: PII সেল রেফারেন্স করে এমন সেলের ফর্মুলা খুঁজুন। সেই রেফারেন্সগুলি অ্যানোনিমাইজড মানে নির্দেশ করতে আপডেট করুন। অথবা ফর্মুলা-ভিত্তিক PII এক্সপোজার বন্ধ করতে ফর্মুলাকে তার ফলাফল দিয়ে প্রতিস্থাপন করুন।
কাঠামো স্তর: পিভট টেবিল ডেটা ক্যাশ সাফ করুন। লুকানো সারি এবং কলাম প্রক্রিয়া করুন। VBA ম্যাক্রো কোড পরিচালনা করুন যা নির্দিষ্ট সেল ঠিকানা বা মান ব্যবহার করে।
তিনটি স্তর একসাথে চলতে হবে। ফর্মুলা ঠিক না করে মান ঠিক করলে PII থেকে যায়। ক্যাশ সাফ না করে ফর্মুলা ঠিক করলেও একই ফল।
এই চ্যালেঞ্জ প্রতিটি ফাইল ফরম্যাটে বিস্তৃত। বিস্তৃত দৃষ্টিভঙ্গির জন্য ফরম্যাট ফ্র্যাগমেন্টেশন PII ডিটেকশনকে কীভাবে প্রভাবিত করে দেখুন।
API স্তরে কাঠামোবদ্ধ ডেটা নিয়ে কাজ করা দলের জন্য, রিয়েল-টাইম API-তে GDPR ডেটা মিনিমাইজেশন দেখুন।
আপনার দল যদি বড় DSAR এক্সপোর্ট চালায়, ওয়ার্কফ্লো প্যাটার্নের জন্য স্কেলে GDPR DSAR ব্যাচ প্রক্রিয়াকরণ দেখুন।