মিশ্র ফরম্যাট ই-ডিসকভারি: সম্মতির ফাঁক বন্ধ করা
একটি ডকুমেন্ট প্রোডাকশন অনুরোধ আসে। সেটে পাঁচটি ফরম্যাট: PDF চুক্তি, Word ডকুমেন্ট, Excel স্প্রেডশিট, CSV এক্সপোর্ট এবং JSON লগ। প্রতিটি ফরম্যাটের জন্য আলাদা টুল দরকার। এটাই সমস্যা।
২০২৫ সালের Everlaw ই-ডিসকভারি রিপোর্ট দেখা গেছে যে আইনি দলগুলো মিশ্র-ফরম্যাট প্রোডাকশনের জন্য গড়ে ৩.২টি টুল ব্যবহার করে। পরিচালনাগত খরচ বেশি। সম্মতির ঝুঁকি আরও বেশি।
আমরা কীভাবে ডকুমেন্ট প্রোডাকশন পরিচালনা করি তা জানতে আমাদের আইনি সম্মতি ওভারভিউ এবং নিরাপত্তা অনুশীলন দেখুন।
কেন টুল বিভাজন ফাঁক তৈরি করে
আলাদা টুল মানে আলাদা মানদণ্ড। তিনটি দুর্বলতা অনুসরণ করে।
সত্তা কভারেজ টুল অনুযায়ী ভিন্ন হয়। Adobe Acrobat আপনার হাতে টাইপ করা টেক্সট স্ট্রিং খোঁজে। এটি নিজে থেকে সত্তা সনাক্ত করে না। একটি Word ম্যাক্রো নাম এবং ইমেইল ধরতে পারে। এটি সম্ভবত ২৮০+ অন্যান্য সত্তার ধরন মিস করে। Excel-এর ফাইন্ড-এন্ড-রিপ্লেস কেবল আপনার টাইপ করা জিনিস ধরে। PDF এবং Excel ফাইলে একই SSN আলাদা টুল থেকে আলাদা আচরণ পেতে পারে।
অডিট ট্রেইল আলাদা হয়ে যায়। প্রতিটি টুল তার নিজস্ব কাজ লগ করে — বা একেবারেই না। একটি DPA জিজ্ঞেস করতে পারে সমস্ত ব্যক্তিগত ডেটা কীভাবে খোঁজা এবং পরিচালনা করা হয়েছিল। তিনটি টুল থেকে তিনটি আলাদা লগ দুর্বল উত্তর।
সেটিংস সময়ের সাথে পরিবর্তিত হয়। ছয় মাস আগের PDF রিডাকশন নিয়ম গত সপ্তাহে আপডেট হওয়া Word ম্যাক্রোর সাথে নাও মিলতে পারে। একটি প্রোডাকশন ত্রুটি প্রকাশ না হওয়া পর্যন্ত ফাঁকটি লুকিয়ে থাকে।
আদালত এই সমস্যা মোকাবেলা করেছে। ই-ডিসকভারি ত্রুটির জন্য নিষেধাজ্ঞা একক প্রোডাকশনে ডকুমেন্টের ধরন জুড়ে অসামঞ্জস্যপূর্ণ মানদণ্ড উল্লেখ করেছে। আদালত একটি পদ্ধতিগত প্রক্রিয়া আশা করে। ফরম্যাট-নির্দিষ্ট টুল তার বিরুদ্ধে কাজ করে।
DSAR সামঞ্জস্যের প্রয়োজনীয়তা
GDPR DSAR-এ আইনে একটি সামঞ্জস্যের নিয়ম নির্মিত আছে।
অনুচ্ছেদ ১৫ প্রয়োজন করে যে ডেটা বিষয় সমস্ত ব্যক্তিগত ডেটার তথ্য পাবে। PDF-এ সমস্ত ব্যক্তিগত ডেটা এবং Word ডকুমেন্টে বেশিরভাগ নয়। সবটুকু।
ICO DSAR গাইডেন্স এই বিষয়ে স্পষ্ট। প্রতিষ্ঠানগুলোকে সমস্ত সিস্টেম এবং ফরম্যাট জুড়ে একটি পদ্ধতিগত পদ্ধতি প্রয়োগ করতে হবে। সামঞ্জস্যপূর্ণ পদ্ধতি প্রয়োজন। আলাদা মানদণ্ড সহ ফরম্যাট-নির্দিষ্ট টুল এই মানদণ্ড পূরণ করে না।
যখন একটি DPA DSAR অভিযোগ তদন্ত করে, চারটি প্রশ্ন আসে:
- কোন প্রক্রিয়া সমস্ত ব্যক্তিগত ডেটা খুঁজে পেয়েছে?
- কোন টুল কোন ডকুমেন্টের ধরন প্রক্রিয়া করেছে?
- প্রতিটি ফরম্যাটে কোন সত্তার ধরন খোঁজা হয়েছে?
- কোন অডিট ট্রেইল সম্পূর্ণতা প্রমাণ করে?
আলাদা লগ সহ আলাদা টুল ৩ এবং ৪ নম্বর প্রশ্নের পরিষ্কার উত্তর দিতে পারে না।
একীভূত ইঞ্জিনের সুবিধা
একটি একীভূত ইঞ্জিন প্রতিটি ফরম্যাটে একই সনাক্তকরণ লজিক চালায়। চারটি সুবিধা অনুসরণ করে।
সামঞ্জস্যপূর্ণ সত্তা কভারেজ। ৩২টি সত্তার ধরনের একটি প্রিসেট একটি PDF, DOCX, XLSX এবং CSV একইভাবে প্রক্রিয়া করে। Excel-এ SSN PDF-এ SSN-এর মতো একই আস্থার থ্রেশহোল্ড পায়।
একটি অডিট ট্রেইল। একটি লগ একটি ব্যাচের সমস্ত ফাইল কভার করে। এটি ফাইলের নাম, ধরন, সনাক্ত করা সত্তা, আস্থার মান এবং নেওয়া পদক্ষেপ দেখায়। একটি ডকুমেন্ট পুরো প্রোডাকশনের সম্মতি প্রমাণ করে।
রেফারেন্শিয়াল ইন্টিগ্রিটি। ধরুন "সারা জনসন" একটি PDF চুক্তিতে, একটি Word চিঠিতে এবং একটি Excel রেকর্ডে দেখা যায়। একই টোকেন — PERSON_0001 — তিনটিতেই তার নাম প্রতিস্থাপন করে। ডেটা বিষয় পুরো প্রোডাকশন জুড়ে তাদের রেকর্ড ট্রেস করতে পারে।
সহজ ওয়ার্কফ্লো। মিশ্র ফরম্যাটের ১৫টি ফাইল এক ব্যাচে ড্রপ করুন। একটি প্রিসেট প্রয়োগ করুন। ১৫টি বেনামী আউটপুট এবং একটি অডিট রিপোর্ট পান। তিনটি আলাদা টুলের ওয়ার্কফ্লো একটিতে সংকুচিত হয়।
ব্যাচ জবগুলোতে প্রিসেট কীভাবে প্রযোজ্য হয় সে সম্পর্কে আরও জানতে, স্কেলে GDPR DSAR ব্যাচ প্রক্রিয়াকরণ সম্পর্কে আমাদের গাইড দেখুন।
ফেডারেল FOIA: বৃহত্তর স্কেলে একই সমস্যা
মার্কিন ফেডারেল সংস্থাগুলো বেশি পরিমাণে মিশ্র-ফরম্যাটের চ্যালেঞ্জের মুখোমুখি হয়।
FOIA অনুরোধগুলো লিগ্যাসি মেইনফ্রেম এক্সপোর্ট, আধুনিক Word ডকুমেন্ট, স্ক্যান করা PDF আর্কাইভ এবং CSV ও JSON ডেটাবেস এক্সপোর্ট জুড়ে বিস্তৃত। কোনো সংস্থাই এক ফরম্যাট ব্যবহার করে না।
DOJ এবং HHS উভয়ই স্বয়ংক্রিয় রিডাকশন সিস্টেম পাইলট করেছে। ম্যানুয়াল মাল্টি-ফরম্যাট প্রক্রিয়াকরণ তাদের অনুরোধের পরিমাণে স্কেল করে না। প্রতিটি পাইলটের একই মূল প্রয়োজনীয়তা ছিল: সমস্ত ফরম্যাটে এক ছাড়ের মানদণ্ড। একটি নথিভুক্ত অডিট ট্রেইলও প্রয়োজন ছিল।
একই নীতি ফেডারেল সরকারের বাইরেও প্রযোজ্য। মাল্টি-ফরম্যাট সম্মতির প্রয়োজন আছে এমন যেকোনো প্রতিষ্ঠানের একই জিনিস দরকার। একটি মানদণ্ড। একটি অডিট ট্রেইল। এটাই রক্ষণযোগ্য সম্মতি রেকর্ডের ভিত্তি।
আইন সংস্থার কেস স্টাডি
একটি মাঝারি আকারের আইন সংস্থা এন্টারপ্রাইজ ক্লায়েন্টদের জন্য GDPR DSAR প্রতিক্রিয়া পরিচালনা করত।
একীভূতকরণের আগে, সংস্থাটি চারটি আলাদা টুল ব্যবহার করত। Adobe Acrobat PDF পরিচালনা করত। একটি Word ম্যাক্রো DOCX পরিচালনা করত, কেবল নাম এবং ইমেইল কভার করে। Excel ফাইন্ড-এন্ড-রিপ্লেস XLSX পরিচালনা করত। CSV এক্সপোর্ট ম্যানুয়াল পর্যালোচনায় যেত। প্রতিটি DSAR ৮–১২ ঘণ্টা সময় নিত। সমস্ত ফরম্যাট জুড়ে কেবল ২–৩ ধরনের সত্তা একইভাবে পরীক্ষা করা হত।
পরে, একটি একীভূত ইঞ্জিন এক ব্যাচে সমস্ত ফরম্যাট পরিচালনা করত। প্রিসেট: "DSAR EU Individual।" ইঞ্জিন প্রতিটি ফরম্যাটে ৩২ ধরনের সত্তা একইভাবে পরীক্ষা করত। প্রতিটি DSAR এক ঘণ্টারও কম সময় নিত। একটি অডিট রিপোর্ট DPO-র অনুমোদনের জন্য যেত।
সংস্থাটি এখন DSAR প্রোডাকশনের প্রতিটি ডকুমেন্টের ধরন জুড়ে সামঞ্জস্যপূর্ণ সত্তা কভারেজ প্রমাণ করতে পারে। একটি অডিট ডকুমেন্ট প্রতিটি প্রতিক্রিয়া কভার করে। সময় ৮–১২ ঘণ্টা থেকে এক ঘণ্টারও কমে নেমে আসে। এই পরিবর্তন DSAR সম্মতিকে একটি স্কেলযোগ্য সেবায় পরিণত করে যা সংস্থা ক্লায়েন্টদের অফার করতে পারে।
সম্পর্কিত: ডকুমেন্ট ফরম্যাট বিভাজন এবং PII বেনামীকরণ।
উপসংহার
ফরম্যাট বিভাজন একটি সম্মতির দায়। আলাদা টুল মানে আলাদা মানদণ্ড। আলাদা মানদণ্ড অডিট ফাঁক তৈরি করে। অডিট ফাঁক নিয়ন্ত্রক এক্সপোজার আনে।
একটি একীভূত ইঞ্জিন এটি উৎসেই সমাধান করে। একটি সনাক্তকরণ মানদণ্ড। একটি অডিট ট্রেইল। একটি ওয়ার্কফ্লো — প্রতিটি ফরম্যাটের জন্য।