ডিসেম্বর ২০২৫ রিডেকশন ব্যর্থতা
২০২৬ সালের জন্য আপডেট করা হয়েছে
ডিসেম্বর ২০২৫ সালে মার্কিন বিচার বিভাগ এপস্টাইন ফাইলগুলি প্রকাশ করেছে। সংবাদ কভারেজ দ্রুত বিষয়বস্তু থেকে রিডেকশনে সরে গেছে। এটি দেখিয়েছে সেই রিডেকশনগুলি কত সহজে বাইপাস করা যায়।
পদ্ধতিটি সহজ ছিল। PDF ফাইলে "রিডেক্টেড" বিষয়বস্তু কালো হাইলাইটিং দিয়ে ঢেকে দেওয়া হয়েছিল। কিন্তু কথাগুলি PDF-এর টেক্সট লেয়ারে থাকে। কালো বাক্সটি একটি টেক্সট এডিটরে কপি করুন এবং মূল শব্দগুলি দেখা যাবে। ভিজ্যুয়াল কভারটি সত্যিকারের মুছে ফেলা ছিল না। সংবেদনশীল ডেটা কখনো সরানো হয়নি।
আরও তথ্যের জন্য আমাদের সম্মতি ওভারভিউ দেখুন।
ভিজ্যুয়াল কভার বনাম সত্যিকারের রিডেকশন
কেন এটি বারবার ঘটছে? উত্তর একটি মূল প্রযুক্তিগত ফাঁকে।
ভিজ্যুয়াল কভার শব্দের উপর একটি উপাদান রাখে। এটি ফাইল থেকে সেই শব্দগুলি সরায় না। এই পদ্ধতিগুলি সব এই গ্রুপে পড়ে:
- কালো হাইলাইটিং পটভূমিকে কালো করে
- সাদা পাতায় সাদা শব্দ রঙ মেলায়
- পাঠের উপর আঁকা কালো আয়তক্ষেত্র দৃশ্য লুকায়
- PDF অ্যানোটেশন কভার একটি অস্বচ্ছ স্তর যোগ করে
প্রতিটি ক্ষেত্রে, মূল শব্দগুলি ফাইলে থাকে। কপি করে নেওয়া যায়, পড়া যায়।
সত্যিকারের রিডেকশন ফাইল থেকে স্থায়ীভাবে শব্দগুলি সরিয়ে দেয়। বিষয়বস্তু লুকানো নয় — এটি চলে গেছে।
যেকোনো ফাইল পাঠানোর আগে মূল প্রশ্ন: কেউ এই ফাইল পরীক্ষা করলে কি মূল শব্দগুলি পাবে? ভিজ্যুয়াল কভারের ক্ষেত্রে, উত্তর হ্যাঁ। আমাদের শব্দকোষ দেখুন।
Word নথির সমস্যা
Microsoft Word-এও একই ব্যর্থতা বিদ্যমান। কালো হাইলাইটিং বা অস্বচ্ছ বাক্স ব্যবহার করে একটি Word ফাইল "রিডেক্ট" করা নথির XML-এ মূল শব্দগুলি রেখে যায়।
Word হলো আইনি চিঠি, চুক্তি, HR ফাইল এবং অভ্যন্তরীণ পর্যালোচনার প্রধান ফরম্যাট।
৭১% আইনি দল তথ্য সংরক্ষণের উদ্বেগ সত্ত্বেও AI টুল ব্যবহার করে (ACC 2025 সমীক্ষা)। AI টুলগুলি নথির কাজে প্রবেশ করার সাথে সাথে, অতীতের রিডেকশন ব্যর্থতাগুলি সামনে আসার ঝুঁকি বাড়ছে।
উচ্চ-প্রোফাইল রিডেকশন ব্যর্থতা
Anthony Pellicano মামলা (2007): ফেডারেল আদালতে দাখিল করা কাগজপত্রে অনুপযুক্ত রিডেকশনের মাধ্যমে সংবেদনশীল ডেটা প্রকাশিত হয়েছিল।
NSA নথিগুলি: FOIA অনুরোধের মাধ্যমে প্রকাশিত হয়েছে বারবার কালো বাক্সের নিচে পঠনযোগ্য শব্দ সহ।
কর্পোরেট মামলার ফাইলিংগুলি: প্রায়ই পঠনযোগ্য বিষয়বস্তু থাকে যখন পক্ষগুলি PDF অ্যানোটেশন লেয়ার ব্যবহার করে।
এই প্যাটার্নটি একটি মৌলিক ফাঁক দেখায়। আইনি দলগুলি রিডেকশনকে একটি দৃশ্যগত কাজ হিসেবে মনে করে।
সত্যিকারের রিডেকশনের জন্য প্রয়োজনীয়তা
কোনো ফাইল সত্যিকারের রিডেক্টেড হতে হলে, শব্দগুলি সরিয়ে প্রতিস্থাপন করতে হবে।
PDF ফাইলে, সত্যিকারের রিডেকশনে চারটি জিনিস দরকার:
- সব সম্পাদনাযোগ্য লেয়ার সরিয়ে PDF ফ্ল্যাটেন করা
- কন্টেন্ট স্ট্রিম স্তরে বিষয়বস্তু প্রতিস্থাপন
- মূল শব্দ ধারণকারী মেটাডেটা সরানো
- পুনরুদ্ধার সক্ষম এমবেডেড ফন্ট সরানো
Word ফাইলে, সত্যিকারের রিডেকশন মানে:
- লক্ষ্য বিষয়বস্তুর প্রতিটি দৃষ্টান্ত খুঁজে বের করা — ট্র্যাক করা পরিবর্তন, মন্তব্য, মেটাডেটায়
- বিষয়বস্তু প্রতিস্থাপন করা, ভিজ্যুয়ালি ঢেকে না দেওয়া
- চিহ্ন না রেখে ফরম্যাট সংরক্ষণ করা
মূল শব্দটি হলো প্রতিস্থাপন। মূল বিষয়বস্তু অবশ্যই অন্য কিছু দিয়ে প্রতিস্থাপিত হতে হবে, এর নিচে লুকানো নয়।
একটি সম্মতিমূলক প্রক্রিয়া তৈরি করা
এই ব্যর্থতার পদ্ধতিগুলি দেওয়া, একটি সঠিক রিডেকশন প্রক্রিয়ার চারটি ধাপ প্রয়োজন:
১. Word ফাইলের জন্য নেটিভ Word ইন্টিগ্রেশন ব্যবহার করুন। Word অবজেক্ট মডেলের মধ্যে রিডেকশন সরাসরি ফাইলে বিষয়বস্তু প্রতিস্থাপন করে।
২. সমস্ত নথি জোন প্রক্রিয়া করুন। হেডার, ফুটার, ফুটনোট, এন্ডনোট, মন্তব্য, ট্র্যাক করা পরিবর্তন এবং নথির বৈশিষ্ট্য।
৩. আউটপুট যাচাই করুন। রিডেকশনের পরে, বিষয়বস্তু পুনরুদ্ধার করার চেষ্টা করুন। রিডেক্টেড এলাকাগুলি কপি-পেস্ট করুন। নথির XML পরীক্ষা করুন।
৪. একটি অডিট ট্রেইল রাখুন। আইনি উৎপাদনের জন্য, কী রিডেক্ট করা হয়েছিল, কোন পদ্ধতিতে, এবং কার দ্বারা রেকর্ড করুন। আমাদের নিরাপত্তা ও সম্মতি পাতায় আরও জানুন।
এপস্টাইন ফাইল থেকে শিক্ষা
এপস্টাইন ফাইলের ব্যর্থতা একটি পাবলিক পাঠ ছিল। প্রতিটি আইনি দল এবং সম্মতি পেশাদার যারা এই গল্প দেখেছেন তাদের দুটি প্রশ্ন জিজ্ঞাসা করা উচিত: আমাদের অতীতের নথি উৎপাদনে কী আছে যা একইভাবে পুনরুদ্ধার করা যেতে পারে? এবং আমাদের বর্তমান প্রক্রিয়া কি আসলে বিষয়বস্তু মুছে দেয় নাকি কেবল ঢেকে দেয়?
anonym.legal-এর Office Add-in Word ফাইলের মধ্যে সত্যিকারের PII প্রতিস্থাপন করে। এটি নথির কাঠামোতে সরাসরি বিষয়বস্তু প্রতিস্থাপন করে, ভিজ্যুয়ালি ঢাকে না। হেডার, ফুটার, ফুটনোট, মন্তব্য এবং ট্র্যাক করা পরিবর্তন সব প্রক্রিয়া করা হয়। আরও জানুন।