২০২৬ সালের জন্য আপডেট করা হয়েছে
একটি সমাধান, দুটি নতুন ঝুঁকি
অনেক প্রতিষ্ঠান এখন AI লিক ঠেকাতে নাম ও আইডি সরিয়ে দেয় — AI প্রোভাইডারে পাঠানোর আগেই। ওয়ান-ওয়ে হ্যাশিং, হার্ড রিড্যাকশন বা সম্পূর্ণ মুছে ফেলা — সব কিছুই নিরাপদ মনে হয়। AI পরিষ্কার টেক্সট পায়। সংবেদনশীল তথ্য ভেতরে থাকে।
নিরাপত্তার দিক থেকে যুক্তিটি ঠিক আছে। Cyberhaven-এর Q4 2025 গবেষণায় দেখা গেছে ChatGPT-এ পাঠানো ৩৪.৮% কন্টেন্ট সংবেদনশীল ডেটা বহন করে। Ponemon-এর ২০২৪ প্রতিবেদনে AI লঙ্ঘনের গড় ব্যয় $২.১ মিলিয়ন নির্ধারিত হয়েছে। ঝুঁকি বাস্তব এবং ব্যয় বেশি।
কিন্তু সম্পূর্ণ মুছে ফেলা এক ঝুঁকির পরিবর্তে আরেকটি ঝুঁকি নিয়ে আসে: প্রমাণ বিনাশ (spoliation)।
মামলা বা নিরীক্ষার আওতায় থাকা প্রতিষ্ঠানের জন্য কাঁচা রেকর্ড পুনরুদ্ধারের সক্ষমতা নষ্ট করা ফেডারেল ও রাজ্য আইনে স্পোলিয়েশন হিসেবে গণ্য হতে পারে।
AI শেয়ারিংয়ের মাত্রা
eSecurity Planet ও Cyberhaven-এর গবেষণায় দেখা গেছে ৭৭% কর্মী প্রতি সপ্তাহে AI টুলে সংবেদনশীল ডেটা শেয়ার করেন। এটি আইনি, স্বাস্থ্যসেবা, আর্থিক ও প্রযুক্তি খাত জুড়ে ছড়িয়ে আছে।
শেয়ার করা কন্টেন্টে প্রায়ই থাকে:
- ক্লায়েন্ট চিঠি ও মামলার নোট
- চুক্তির খসড়া ও ডিলের শর্ত
- অভ্যন্তরীণ পরিকল্পনা ও ব্যবসায়িক রেকর্ড
- আর্থিক মডেল ও প্রজেকশন
- আইনি মেমো ও মামলার নোট
- রোগীর রেকর্ড ও ক্লিনিক্যাল নোট
- HR ফাইল ও কর্মীদের বার্তা
যখন সম্পূর্ণ মুছে ফেলা AI নিয়ন্ত্রণ হিসেবে ব্যবহৃত হয়, তখন এর মধ্য দিয়ে যাওয়া প্রতিটি নথির আইনি মূল্য হারিয়ে যেতে পারে। যদি সেই নথিগুলো কোনো মামলায় সামনে আসে — নিয়ন্ত্রিত খাতের প্রতিষ্ঠানগুলোর জন্য যা বহু বছরের মধ্যে প্রায় অনিবার্য — তাহলে প্রতিষ্ঠানটি সম্ভাব্যভাবে প্রমাণ হারিয়ে ফেলেছে।
আমাদের আইনি সম্মতি ওভারভিউ দেখুন, কীভাবে anonym.legal ডিসকভারির দায়িত্ব পূরণ করে। মাস্কিং পাইপলাইন কীভাবে কাজ করে তা দেখতে টোকেন সিস্টেম গাইড পড়ুন।
GDPR: বিপরীতযোগ্যতা বাধ্যতামূলক
GDPR অনুচ্ছেদ ৪(৫) সিউডোনিমাইজেশনকে এভাবে সংজ্ঞায়িত করে: ব্যক্তিগত রেকর্ড এমনভাবে প্রক্রিয়া করা যাতে সেগুলো "অতিরিক্ত তথ্য ব্যবহার ছাড়া নির্দিষ্ট ডেটা সাবজেক্টকে আর আরোপ করা যায় না, যদি এই অতিরিক্ত তথ্য আলাদাভাবে রাখা হয়।"
মূল বিষয়: পুনঃসংযোগ সক্ষম করার অতিরিক্ত কী অবশ্যই রাখতে হবে। সংরক্ষিত কী দিয়ে পুনঃসংযোগযোগ্য রেকর্ড GDPR-এ সিউডোনিমাইজড হিসেবে গণ্য হয়।
যেসব রেকর্ড মোটেই পুনঃসংযোগযোগ্য নয়, সেগুলো সিউডোনিমাইজড নয় — সেগুলো অ্যানোনিমাইজড। পার্থক্যটি গুরুত্বপূর্ণ:
- টোকেন-মাস্কড রেকর্ড কিছু GDPR দায়িত্ব বহন করে কিন্তু আইনি ব্যবহারের জন্য পুনরুদ্ধারযোগ্য।
- সম্পূর্ণ মুছে ফেলা রেকর্ড GDPR-এর বাইরে পড়তে পারে কিন্তু মোটেই পুনরুদ্ধারযোগ্য নয়।
ইউরোপিয়ান ডেটা প্রটেকশন বোর্ডের Guidelines 05/2022 নিশ্চিত করে যে বিপরীতযোগ্যতা সংজ্ঞার মূল অংশ। ওয়ান-ওয়ে রিমুভাল ব্যবহারকারী প্রতিষ্ঠানগুলো GDPR সিউডোনিমাইজেশন করছে না — তারা রেকর্ড পুনরুদ্ধারের সক্ষমতা কেটে দিচ্ছে।
আরও জানতে আমাদের কনফরম্যান্স হাব এবং সুরক্ষা ওভারভিউ দেখুন।
ফেডারেল নিয়ম: স্পোলিয়েশন পরীক্ষা
ফেডারেল রুলস অব সিভিল প্রসিডিউরের অধীনে, পক্ষগুলোকে সম্ভাব্য প্রাসঙ্গিক রেকর্ড সংরক্ষণ করতে হবে। এই দায়িত্ব শুরু হয় যখন মামলা যুক্তিসঙ্গতভাবে পূর্বাভাসযোগ্য — দায়ের হলে নয়।
Rule 37(e) আদালতকে শাস্তি আরোপের অনুমতি দেয় যখন কোনো পক্ষ সংরক্ষিত রেকর্ড সংরক্ষণে ব্যর্থ হয়। শাস্তিতে অন্তর্ভুক্ত হতে পারে:
- প্রতিকূল অনুমান নির্দেশ
- প্রমাণ বাদ দেওয়া
- গুরুতর ক্ষেত্রে মামলা-সমাপ্তিকারী নিষেধাজ্ঞা
ব্যাপারটি এভাবে কাজ করে। একটি প্রতিষ্ঠান AI ওয়ার্কফ্লো ব্যবহার করে যা স্বাভাবিক ব্যবসায়িক কার্যক্রমে সংবেদনশীল কন্টেন্ট সম্পূর্ণ মুছে দেয়। পরে সেই রেকর্ডগুলো মামলার জন্য প্রাসঙ্গিক হয়ে ওঠে। প্রতিষ্ঠানটি সেগুলো এমনভাবে পরিবর্তন করে ফেলেছে যে কাঁচা টেক্সট পুনরুদ্ধার করা যাচ্ছে না। যদি এটি সংরক্ষণের দায়িত্ব সংযুক্ত হওয়ার পরে ঘটে থাকে, তাহলে স্পোলিয়েশনের এক্সপোজার অনুসরণ করে।
এটি কোনো প্রান্তিক ঘটনা নয়। নিয়ন্ত্রিত খাতের প্রতিষ্ঠানগুলো ব্যাপক ডকুমেন্ট ধরনে ক্রমাগত পূর্বাভাসযোগ্য মামলার মুখোমুখি হয়। কার্ভ-আউট ছাড়াই সব ওয়ার্কফ্লোতে সম্পূর্ণ রিমুভাল প্রয়োগ করলে বড় স্পোলিয়েশন ঝুঁকি তৈরি হয়।
বিপরীতযোগ্য বনাম অপরিবর্তনীয়: মূল পার্থক্য
বিপরীতযোগ্য এবং ওয়ান-ওয়ে মাস্কিংয়ের পার্থক্য ডিজাইনে।
ওয়ান-ওয়ে: ফেরার পথ নেই
একটি নামের SHA-256 হ্যাশিং একটি স্থির হ্যাশ তৈরি করে। হ্যাশ থেকে নাম পাওয়া যায় না। হার্ড রিড্যাকশন টেক্সট সরিয়ে দেয় যাতে কাঁচা কন্টেন্ট চলে যায়।
বিপরীতযোগ্য: পুনরুদ্ধার সম্ভব
কী রিটেনশন সহ টোকেন সাবস্টিটিউশন এবং AES-256-GCM এনক্রিপশন উভয়ই রেকর্ড রূপান্তরিত করে এমনভাবে যা পূর্বাবস্থায় ফেরানো যায়। একটি টোকেন দিয়ে প্রতিস্থাপিত নাম লুকআপ টেবিলের মাধ্যমে পুনরুদ্ধার করা যায়। AES-256-GCM কন্টেন্ট সঠিক কী দিয়ে ডিক্রিপ্ট করা যায়। কাঁচা টেক্সট সহজলভ্য থাকে।
AI সুরক্ষার জন্য, উভয় পদ্ধতি একইভাবে কাজ করে। AI টোকেন প্রক্রিয়া করে এবং কখনও আসল রেকর্ড দেখে না।
আইনি দায়িত্বের জন্য, শুধুমাত্র বিপরীতযোগ্য টোকেন মাস্কিং কাজ করে। ওয়ান-ওয়ে পদ্ধতি পুনরুদ্ধার বন্ধ করে দেয় এবং উপরে উল্লিখিত স্পোলিয়েশন ঝুঁকি তৈরি করে।
আমাদের টোকেন সিস্টেম কীভাবে শুরু থেকে শেষ পর্যন্ত এটি পরিচালনা করে তা পড়ুন। আরও প্রসঙ্গের জন্য গ্লসারি ও FAQ দেখুন।
দ্বৈত-সম্মত ডিজাইন
AI নিরাপত্তা এবং আইনি প্রকাশ উভয় দায়িত্ব পূরণ করে এমন একটি ডিজাইন বিপরীতযোগ্য AES-256-GCM টোকেন মাস্কিং ব্যবহার করে:
- রেকর্ডগুলো যেকোনো AI টুলে পৌঁছানোর আগে প্রক্রিয়া করা হয়।
- সংবেদনশীল আইটেম — নাম, আইডি, PHI, বিশেষাধিকারযুক্ত কন্টেন্ট — কাঠামোগত টোকেন দিয়ে বদলে দেওয়া হয়।
- টোকেন ম্যাপ ডেটার ধরন অনুযায়ী অ্যাক্সেস নিয়ন্ত্রণ সহ আলাদা স্টোরে রাখা হয়।
- AI প্রক্রিয়াকরণ টোকেন কপিতে চলে। AI কখনও আসল রেকর্ড দেখে না।
- ফলাফল স্বাভাবিক ব্যবসায়িক ব্যবহারের জন্য টোকেন ম্যাপ দিয়ে পুনরুদ্ধার করা হয়।
- ডিসকভারির দায়িত্ব সংযুক্ত হলে টোকেন ম্যাপ লিগ্যাল হোল্ডের অধীনে রাখা হয়।
এই ডিজাইনে কোনো কাঁচা কন্টেন্ট কখনও হারিয়ে যায় না। AI প্রোভাইডার কখনও ব্যবহারযোগ্য আকারে এটি দেখে না। টোকেন ম্যাপ পুনরুদ্ধার সম্ভব রাখে যখন আইন এটি দাবি করে। স্পোলিয়েশনের ঝুঁকি থাকে না — কোনো রেকর্ড নষ্ট হয় না, শুধু মাস্ক করা হয় এমনভাবে যা পূর্বাবস্থায় ফেরানো যায়।
GDPR অনুচ্ছেদ ৪(৫) পূরণ হয়: অতিরিক্ত কী (টোকেন ম্যাপ) সঠিক প্রযুক্তিগত ও প্রক্রিয়াগত সুরক্ষা সহ আলাদাভাবে রাখা হয়। ফেডারেল নিয়মের সংরক্ষণ দায়িত্ব পূরণ হয়: লিগ্যাল হোল্ড প্রযোজ্য হলে কাঁচা রেকর্ড পুনরুদ্ধার করা যায়।
আমাদের এন্টিটি ডিটেকশন পদ্ধতি, সুরক্ষা ওভারভিউ এবং প্ল্যান ও মূল্য দেখুন।
দ্বিমুখী পছন্দ
প্রতিষ্ঠানগুলো একটি স্পষ্ট দ্বিধা-বিভক্তির মুখোমুখি:
- ডেটা স্থায়ীভাবে মুছুন — AI লিকের সমস্যা সমাধান হয় কিন্তু আইনি ঝুঁকি তৈরি হয়।
- বিপরীতযোগ্য টোকেন মাস্কিং ব্যবহার করুন — একসাথে সুরক্ষা ও সম্মতির প্রয়োজন পূরণ হয়।
$২.১ মিলিয়ন গড় AI লঙ্ঘন ব্যয় নিরাপত্তার সিদ্ধান্তকে চালিত করে। কিন্তু স্পোলিয়েশন নিষেধাজ্ঞাও সস্তা নয়। বড় আর্থিক দাবিযুক্ত মামলায় ব্যয় একই মাত্রায় পৌঁছাতে পারে। উভয় ঝুঁকিই সিদ্ধান্তে জায়গা পাওয়ার দাবি রাখে।
একটি সুদৃঢ় AI নীতি উভয় প্রান্ত কভার করে। এটি সংবেদনশীল রেকর্ডকে ব্যবহারযোগ্য আকারে প্রতিষ্ঠানের বাইরে যাওয়া থেকে আটকায়। এবং একই রেকর্ড পৌঁছানোযোগ্য রাখে যখন আদালত বা নিয়ন্ত্রক সেগুলো চায়। বিপরীতযোগ্য টোকেন মাস্কিং একমাত্র পদ্ধতি যা একসাথে উভয় কাজ করে।
আরও পটভূমির জন্য আমাদের প্রতিষ্ঠাতার বক্তব্য ও কেস স্টাডি দেখুন।