SSN-এর বাইরে: আপনার সংস্থার অভ্যন্তরীণ ID অ্যানোনিমাইজ করা
আপনার GDPR সরঞ্জাম ইমেইল ঠিকানা সরায়। ফোন নম্বর সরায়। নাম সরায়। আপনি সাপোর্ট export এর মধ্য দিয়ে চালান। তারপর আপনার analytics টিমের সাথে আউটপুট শেয়ার করুন।
আপনার গ্রাহক অ্যাকাউন্ট নম্বর এখনও প্রতিটি টিকিটে আছে। আপনার অর্ডার ID এখনও সেখানে আছে। আপনার অভ্যন্তরীণ ব্যবহারকারী ID-ও সেখানে আছে।
এই ID গুলো নিজে থেকে নিরীহ দেখায়। একটি lookup table ছাড়া, তারা কোনো ব্যক্তির নাম বলে না। কিন্তু আপনার analytics টিম সেই টেবিল আছে। আপনার CRM-এ আছে। যেকেউ অ্যাক্সেস সহ সেকেন্ডের মধ্যে ব্যক্তি খুঁজে পেতে পারে।
এটি একটি GDPR ব্যর্থতা। সরঞ্জামটি ভাঙেনি। এটি কখনই আপনার ID-এর জন্য দেখতে বলা হয়নি।
মানক PII সরঞ্জাম কী সনাক্ত করে
মানক PII সরঞ্জাম সর্বজনীন ফরম্যাট কভার করে।
মানক সরঞ্জাম সনাক্ত করে:
- সামাজিক নিরাপত্তা নম্বর (US SSN, UK NINO, EU জাতীয় ID ফরম্যাট)
- ইমেইল ঠিকানা
- ফোন নম্বর
- ক্রেডিট কার্ড নম্বর
- নাম
- পাসপোর্ট এবং ড্রাইভার লাইসেন্স নম্বর
মানক সরঞ্জাম সনাক্ত করে না:
- আপনার EMP-XXXXX ফরম্যাটে কর্মী ID
- আপনার ACC-XXXXXXXX-XX ফরম্যাটে গ্রাহক অ্যাকাউন্ট নম্বর
- আপনার ORD-XXXXXXX ফরম্যাটে অর্ডার ID
- UUID বা কাস্টম ফরম্যাটে অভ্যন্তরীণ ব্যবহারকারী ID
- অংশীদার-নির্দিষ্ট রেফারেন্স কোড
পুনরায় সনাক্তকরণের ঝুঁকি
একটি ফার্ম মান পর্যালোচনার জন্য সাপোর্ট টিকিট export করে। মানক PII অপসারণ নাম, ইমেইল এবং ফোন নম্বর সরিয়ে দেয়। ACC-XXXXXXXX-XX ফরম্যাটে অ্যাকাউন্ট নম্বর স্পর্শ করা হয় না।
এক্সপোর্ট analytics টিমে যায়। একজন বিশ্লেষক অ্যাকাউন্ট নম্বরে গ্রাহক ডাটাবেসের সাথে টিকিট টেবিল যোগ করেন। ব্যক্তি তাৎক্ষণিকভাবে পাওয়া যায়।
GDPR আর্টিকেল 4(5) pseudonymization কে প্রক্রিয়াকরণ হিসেবে সংজ্ঞায়িত করে যেখানে ডেটা "অতিরিক্ত তথ্য ব্যবহার ছাড়া আর নির্দিষ্ট ডেটা বিষয়কে দায়ী করা যায় না।" অ্যাকাউন্ট নম্বর সেই পরীক্ষায় ব্যর্থ হয়। অতিরিক্ত তথ্য — আপনার গ্রাহক ডাটাবেস — আপনার সংস্থায় ঠিক সেখানেই আছে।
কাস্টম এন্টিটি প্যাটার্ন তৈরি করা
কাস্টম এন্টিটি সেটআপ দ্রুত। সম্মতি টিম কোনো ইঞ্জিনিয়ারিং সহায়তা ছাড়াই এটি করতে পারে।
ধাপ 1: আপনার ID ফরম্যাট তালিকাভুক্ত করুন।
প্রতিটি লিখুন। উদাহরণস্বরূপ: অ্যাকাউন্ট ACC-XXXXXXXX-XX, অর্ডার ID ORD-XXXXXXX, কর্মী ID EMP-XXXXX।
ধাপ 2: সাধারণ ভাষায় ফরম্যাট বর্ণনা করুন।
"অ্যাকাউন্ট নম্বর ACC দিয়ে শুরু হয়, তারপর একটি ড্যাশ, তারপর 8 সংখ্যা, তারপর একটি ড্যাশ, তারপর 2 uppercase অক্ষর।"
AI-সহায়তা প্যাটার্ন প্রজন্ম ফেরত দেয়: ACC-\d{8}-[A-Z]{2}
ধাপ 3: নমুনা ডেটায় পরীক্ষা করুন।
20 থেকে 30 ডকুমেন্ট আপলোড করুন। নিশ্চিত করুন সব ইনস্ট্যান্স পাওয়া গেছে। কোনো false hit নেই নিশ্চিত করুন।
ধাপ 4: একটি পদ্ধতি বেছে নিন।
join কী হিসেবে ব্যবহৃত ID-এর জন্য, যেখানে বিশ্লেষণে রেকর্ড লিঙ্ক করতে হয়:
- Pseudonymize। ACC-00123456-AB কে ACC-99876543-XY দিয়ে প্রতিস্থাপন করুন। একই ইনপুট সবসময় একই আউটপুট দেয়। Join এখনও কাজ করে।
বিশ্লেষণে প্রয়োজন নেই এমন ID-এর জন্য:
- Redact। [REDACTED] দিয়ে প্রতিস্থাপন করুন।
ধাপ 5: শেয়ার করা preset হিসেবে সংরক্ষণ করুন।
কাস্টম এন্টিটি একটি শেয়ার করা preset-এ সংরক্ষণ করুন। নতুন টিম সদস্যরা একবারে সম্পূর্ণ কনফিগ পান।
কেস স্টাডি: 180,000 সাপোর্ট টিকিট
একটি ফার্ম তাদের analytics ওয়্যারহাউসে 180,000 সাপোর্ট টিকিট পেয়েছে। নাম এবং ইমেইল সরানো হয়েছিল। অ্যাকাউন্ট নম্বর সরানো হয়নি। প্রতিটি টিকিটে এখনও একটি লাইভ ACC-XXXXXXXX-XX মান ছিল।
সমাধানের টাইমলাইন:
- সম্মতি কর্মকর্তা ACC প্যাটার্ন সংজ্ঞায়িত করেন — 15 মিনিট
- 30 নমুনা টিকিটে পরীক্ষা করেন — 20 মিনিট
- নির্ভুলতা নিশ্চিত করেন — 10 মিনিট
- রাতারাতি ব্যাচে 180,000 টিকিট প্রক্রিয়া করেন
- পরিষ্কার সংস্করণ দিয়ে ওয়্যারহাউস টেবিল প্রতিস্থাপন করেন
সম্মতি কর্মকর্তার মোট সময়: 45 মিনিট।
কাস্টম ID কোথায় ছড়িয়ে পড়ে
অভ্যন্তরীণ ID বেশিরভাগ টিমের প্রত্যাশার চেয়ে বেশি জায়গায় প্রদর্শিত হয়।
অভ্যন্তরীণ ডকুমেন্ট:
- অ্যাকাউন্ট বা অর্ডার ID রেফারেন্স সহ মিটিং নোট
- গ্রাহক কেস সম্পর্কে ইমেইল থ্রেড
- কেস স্টাডি ডেটা সহ প্রেজেন্টেশন
তৃতীয় পক্ষের সাথে শেয়ার:
- কেস রেফারেন্স নম্বর সহ নিয়ন্ত্রকদের রিপোর্ট
- গ্রাহক রেফারেন্স সহ অডিট ফাইল
- গ্রাহক ID বহনকারী বিক্রেতা ফাইল
গবেষণা এবং analytics:
- গ্রাহক যাত্রা ডেটাসেট
- সাপোর্ট মান পর্যালোচনা export
- অভ্যন্তরীণ ML মডেলের জন্য প্রশিক্ষণ ডেটা
Pseudonymization বনাম Anonymization
GDPR একটি স্পষ্ট রেখা টানে।
Pseudonymization ID কে stand-in দিয়ে প্রতিস্থাপন করে। মূল ব্যক্তি আবার খুঁজে পাওয়া যাবে যদি কেউ lookup টেবিল থাকে। এই ডেটা এখনও ব্যক্তিগত ডেটা। এটি ঝুঁকি কমায়। এটি আপনার GDPR দায়িত্ব দূর করে না।
Anonymization পুনরায় সনাক্তকরণের ক্ষমতা সরিয়ে দেয়। বেনামী ডেটা ব্যক্তিগত ডেটা নয়। GDPR এতে প্রযোজ্য নয়।
উপসংহার
ব্যবধানটি একটি সরঞ্জামের ব্যর্থতা নয়। এটি একটি সেটআপ ব্যবধান। কোনো সরঞ্জাম আপনার অ্যাকাউন্ট নম্বর ফরম্যাট জানতে পারে না যদি না আপনি এটি বলেন।
কাস্টম এন্টিটি সেটআপ ঘণ্টার মধ্যে ব্যবধান বন্ধ করে। সম্মতি টিম ফরম্যাট সংজ্ঞায়িত করে, নমুনা ডেটায় পরীক্ষা করে এবং সব ব্যবহার মোডে প্রয়োগ করে। কোনো ইঞ্জিনিয়ারিং সহায়তার প্রয়োজন নেই।