২০২৬-এর জন্য আপডেট করা হয়েছে
রিডেকশন ব্যর্থতার দুটি পথ
আইনি দলগুলো দুটি ব্যর্থতার মোডের মুখোমুখি হয়। উভয়ই বাস্তব দায়বদ্ধতা তৈরি করে।
অপর্যাপ্ত রিডেকশন বিশেষাধিকারপ্রাপ্ত তথ্য বা ব্যক্তিগত তথ্য উন্মুক্ত করে যা লুকানো থাকা উচিত। পক্ষটি এমন উপাদান প্রকাশ করে যা রক্ষা করার অধিকার — এবং প্রায়শই দায়িত্ব — ছিল।
অতিরিক্ত রিডেকশন এমন তথ্য লুকায় যা বিরোধী পক্ষের দেখার অধিকার রয়েছে। আদালত এটিকে বাধাদান হিসেবে বিবেচনা করে। এটি নিষেধাজ্ঞার বিষয় হয়ে ওঠা একটি ডিসকভারি লঙ্ঘন।
কলের উপর সূক্ষ্মতাকে পক্ষপাত দেওয়া AI টুলগুলি ডিজাইন অনুসারে দ্বিতীয় সমস্যা তৈরি করে। একটি AI ইঞ্জিন যা একটি ডকের ৮০% কালো করে তা কিছু মিস করা এড়ায়। কিন্তু ফলাফল অকার্যকর। এটি আদালতের নিষেধাজ্ঞাও আকর্ষণ করতে পারে।
উভয় ব্যর্থতার মোড একই জায়গায় নিয়ে যায়: একজন বিচারক, একটি ব্যাখ্যা এবং খরচ।
Schnitzer Steel মামলা (২০২৪)
২০২৪ সালের Athletics Investment Group v. Schnitzer Steel মামলা দেখায় আদালত কীভাবে অনুপযুক্ত নথি আটকে রাখার বিষয়টি পরিচালনা করে।
এক পক্ষ ব্যাপক চিহ্নিতকরণ সহ নথি উৎপাদন করেছিল। বিরোধী পক্ষ পুশব্যাক করেছিল। আদালত উপকরণগুলি দেখেছিল। এটি খুঁজে পেয়েছিল যে চিহ্নিতকরণ আইন যা অনুমতি দেয় তার বাইরে চলে গেছে।
ফলাফল: ফেডারেল সিভিল প্রসিডিউরের নিয়ম ৩৭ অনুযায়ী নিষেধাজ্ঞা। উৎপাদনকারী পক্ষ ত্রুটিপূর্ণ প্রক্রিয়ার জন্য অর্থ প্রদান করেছিল।
এই ধরনের নিষেধাজ্ঞা নতুন নয়। আদালত বছরের পর বছর ধরে এগুলি ব্যবহার করেছে। এই মামলাটি যা আলাদা করে তা হল সময়। AI-সহায়তা পর্যালোচনা এখন মামলায় সাধারণ। মামলাটি একটি মূল প্রশ্ন উত্থাপন করে: আইনি দলগুলো কি তাদের AI টুলগুলির সূক্ষ্মতা উৎপাদনে ব্যবহারের আগে পরীক্ষা করেছে?
উত্তরটি গুরুত্বপূর্ণ। দুর্বল সূক্ষ্মতার একটি টুল অনেক বেশি পতাকা দেবে। যে অ্যাটর্নি পরীক্ষা না করে এটির উপর নির্ভর করেন তিনি ঝুঁকি বহন করেন।
একটি সম্পূর্ণ মামলা বিশ্লেষণের জন্য, E-Discovery LLC-র প্রাসঙ্গিকতা-ভিত্তিক আটকে রাখার বিশ্লেষণ দেখুন।
২২.৭% সূক্ষ্মতার সমস্যা
Presidio হল Microsoft নির্মিত একটি ওপেন-সোর্স PII ডিটেকশন ইঞ্জিন। এটি নথি পর্যালোচনা টুলগুলিতে ব্যাপকভাবে ব্যবহৃত হয়। আদালতের ফাইলিং এবং চুক্তিতে পরীক্ষা এটিকে ২২.৭% সূক্ষ্মতার হার দেয়।
সূক্ষ্মতা পরিমাপ করে একটি পজিটিভ পতাকা কতটা সঠিক। ২২.৭%-এ, প্রতি ১০০ পতাকার মধ্যে প্রায় ৭৭টি মিথ্যা পজিটিভ। সেই আইটেমগুলি কোনো প্রযোজ্য মানদণ্ড দ্বারা সংবেদনশীল নয়।
e-discovery-র জন্য গণিত সরাসরি। সেই হারে প্রক্রিয়া করা ১০,০০০ নথির একটি সেটে হাজার হাজার ভিত্তিহীন চিহ্নিতকরণ থাকবে। উৎপাদনকারী পক্ষ Schnitzer Steel বিবাদীর মতো একই ঝুঁকির মুখোমুখি হয়: একটি চ্যালেঞ্জড উৎপাদন, আদালতের পর্যালোচনা এবং সম্ভাব্য নিষেধাজ্ঞা।
এই সংখ্যাটি আইন সংস্থার কনটেন্টে Presidio-র আউট-অফ-বক্স সেটআপের জন্য। সমস্ত AI টুল এই স্তরে কাজ করে না। কিন্তু এই ইঞ্জিনটি ক্ষেত্রে সবচেয়ে বেশি ব্যবহৃত ওপেন-সোর্স বিকল্প।
কারণটি কাঠামোগত। NLP সিস্টেমগুলি সাধারণ টেক্সটে প্রশিক্ষণ নেয়। আদালতের ভাষা আলাদা। এটি এমন পরিভাষা, উদ্ধৃতি ফরম্যাট এবং খসড়া নিয়ম ব্যবহার করে যা প্রশিক্ষণ ডেটা থেকে বিচ্যুত হয়। মেডিকেল রেকর্ডে ভালো কাজ করা একটি টুল ডিপোজিশন ট্রান্সক্রিপ্টে অনেক খারাপ করতে পারে।
AI ব্যবহারের তথ্য কী দেখায়
এখানে দ্বিতীয় একটি তথ্য বিন্দু: এন্টারপ্রাইজ AI ব্যবহারের স্বাধীন বিশ্লেষণ অনুযায়ী ২৭.৪% AI চ্যাটবট কনটেন্ট সংবেদনশীল।
এটি বর্ণনা করে কর্মচারীরা স্বাভাবিক কাজে কী পাঠায়। তারা যে ডেটা শেয়ার করতে চেয়েছিল তা নয় — অভ্যাস বা দুর্ঘটনাক্রমে অন্তর্ভুক্ত কনটেন্ট। AI ব্যবহার করে চিঠি খসড়া করা, চুক্তি পর্যালোচনা করা বা ডিপোজিশন সারসংক্ষেপ করা অ্যাটর্নিরা স্বাভাবিক কাজের পার্শ্ব-প্রতিক্রিয়া হিসেবে AI সার্ভারে সংবেদনশীল কনটেন্ট পাঠায়।
প্রায় তিনজনের মধ্যে একজন ইন্টারঅ্যাকশনে ক্লায়েন্ট ডেটা, বিশেষাধিকারপ্রাপ্ত তথ্য বা মামলার কৌশল জড়িত। সেই কনটেন্ট AI ভেন্ডরের সার্ভারে পৌঁছায় যদি না নিয়ন্ত্রণ প্রথমে এটি থামায়।
তাদের AI ঝুঁকি পরীক্ষা করছে এমন আইন সংস্থাগুলির জন্য, ২৭.৪% একটি ছোট সমস্যা নয়। এটি বেস রেট। একটি সংস্থায় AI ব্যবহারের প্রায় এক তৃতীয়াংশে সুরক্ষা প্রয়োজন এমন কনটেন্ট জড়িত।
দায়বদ্ধতার শৃঙ্খল
অতিরিক্ত আটকে রাখা এবং AI তথ্য ফাঁস আলাদা কিন্তু সংযুক্ত ঝুঁকির পথ তৈরি করে। উভয়ই একই সিদ্ধান্ত থেকে শুরু হয়: সঠিক মূল্যায়ন ছাড়াই একটি AI টুল মোতায়েন করা।
ডিসকভারি পথ: AI কনটেন্ট ব্যাপকভাবে পতাকা দেয় → অ্যাটর্নি স্পট-চেক ছাড়াই আউটপুটের উপর নির্ভর করেন → উৎপাদনে অন্যায্য চিহ্নিতকরণ রয়েছে → বিরোধী পক্ষ আপত্তি করে → আদালত পর্যালোচনা করে → নিষেধাজ্ঞা।
তথ্য ফাঁসের পথ: অ্যাটর্নি মামলার কাজে AI ব্যবহার করেন → AI বিশেষাধিকারপ্রাপ্ত যোগাযোগ পায় → AI ভেন্ডর লঙ্ঘনের শিকার হয় → ক্লায়েন্টের ডেটা উন্মুক্ত হয় → ম্যালপ্র্যাকটিসের দাবি অনুসরণ করে।
শুরুর বিন্দু উভয় ক্ষেত্রেই একই। সংস্থাগুলি এই টুলগুলি আসলে কী করে তা না জেনে AI টুল মোতায়েন করে। কাজের জন্য কোনো নিয়ন্ত্রণ স্থাপন করা হয় না।
উৎপাদনের জন্য সূক্ষ্মতা-প্রথম পর্যালোচনা
বিতর্কিত চিহ্নিতকরণ পর্যালোচনা করার সময় আদালত একটি সংকীর্ণ প্রশ্ন জিজ্ঞাসা করে। প্রতিটি কি বিশেষাধিকার, গোপনীয়তার নিয়ম বা আদালতের আদেশ দ্বারা সমর্থিত ছিল? আদালত জিজ্ঞাসা করে না যে উৎপাদনকারী পক্ষের টুল যতটা সম্ভব পতাকা দিয়েছিল কিনা।
সঠিক ভিত্তি ছাড়া একটি চিহ্নিতকরণ একটি ডিসকভারি লঙ্ঘন। এটি কোনো মানুষ বা AI করেছে কিনা তা বিবেচ্য নয়। তদন্ত চিহ্নিতকরণ-দ্বারা-চিহ্নিতকরণ।
অ্যাটর্নিদের জন্য, এর অর্থ হল AI পর্যালোচনা টুলগুলিকে সূক্ষ্মতায় পরীক্ষা করতে হবে — পতাকাগুলির অনুপাত যা সত্যিকার অর্থে বিশেষাধিকারপ্রাপ্ত। শুধু কল নয়। ২২.৭% সূক্ষ্মতায় ৯০% কলে পৌঁছানো একটি টুল আরও সংবেদনশীল কনটেন্ট ধরে। কিন্তু এটি ৭৭.৩% মিথ্যা পতাকার জন্য একটি পর্যালোচনার বোঝা তৈরি করে। সেই পর্যালোচনা না হলে, ব্যাপক অতিরিক্ত আটকে রাখা অনুসরণ করে।
একটি উৎপাদনে প্রতিটি চিহ্নিতকরণ আদালতের কাছে একটি দাবি। এটি বলে: এই কনটেন্ট বৈধভাবে আটকানো হয়েছে। Schnitzer Steel-এর পরে, সেই দাবি টিকে থাকতে হবে।
অ্যানোনিমাইজেশন টুল এবং স্ট্যান্ডার্ড PII ডিটেকশনের মধ্যে পার্থক্যের জন্য আমাদের আইনি নথি পর্যালোচনায় AI সূক্ষ্মতার গাইড দেখুন। বিশেষাধিকার লগ এবং AI টুলের প্রসঙ্গের জন্য অ্যাটর্নি-ক্লায়েন্ট বিশেষাধিকার এবং AI দেখুন।