CNIL ফ্রান্স: GDPR প্রযুক্তিগত সম্মতি
ফ্রান্সের সবচেয়ে কঠোর গোপনীয়তা নিয়ন্ত্রক
ফ্রান্সের তথ্য সংস্থা হলো CNIL। এটি EU-এর সবচেয়ে সঠিক গোপনীয়তার নিয়ম নির্ধারণ করে। বেশিরভাগ EU নিয়ন্ত্রক ব্যাপক নির্দেশনা লেখে। CNIL আরও এগিয়ে যায়। এটি recommandations নামে নির্ভুল প্রযুক্তিগত স্পেসিফিকেশন প্রকাশ করে। এগুলো সংজ্ঞায়িত করে প্রকৃত GDPR সম্মতি কেমন দেখায়।
অন্যান্য EU নিয়ন্ত্রকরা প্রায়শই CNIL-এর কাজ কপি করে। মূল গ্রন্থগুলোর মধ্যে রয়েছে ২০২৩ সালের Guide pratique de l'anonymisation এবং ২০২৪ সালের AI নির্দেশনা।
সংখ্যাগুলো দেখায় সংস্থাটি সক্রিয়। এটি ২০২৩ সালে ১৬,৪৩৩টি অভিযোগ পরিচালনা করেছে। এটি ২০২২ সালের চেয়ে ৪৩% বেশি। এনফোর্সমেন্ট শুরু হওয়ার পর থেকে এটি প্রায় €১৫০ মিলিয়ন GDPR জরিমানা জারি করেছে।
AI প্রশিক্ষণ: স্ক্রাব করতে ছয়টি রেকর্ড টাইপ
CNIL-এর ২০২৪ AI নির্দেশনা ব্যাপকভাবে প্রযোজ্য। এটি এমন যেকোনো গোষ্ঠীকে কভার করে যারা ফরাসি ব্যক্তিগত রেকর্ডে AI প্রশিক্ষণ দেয়। এটি ফরাসি ব্যবহারকারীদের জন্য AI টুল সরবরাহকারীদের ক্ষেত্রেও প্রযোজ্য।
সংস্থাটি ছয়টি রেকর্ড টাইপ তালিকাভুক্ত করেছে যা AI প্রশিক্ষণের আগে স্ক্রাব করা দরকার:
১. Identifiants directs (সরাসরি ID): নাম, ঠিকানা, ID নম্বর। প্রশিক্ষণের আগে এগুলো সরিয়ে দিন বা প্রতিস্থাপন করুন। ২. Identifiants quasi-directs (আধা-ID): এমন বৈশিষ্ট্যের গোষ্ঠী যা পুনরায় শনাক্তকরণের অনুমতি দেয়। k-anonymity চেক প্রয়োগ করুন। ৩. Données sensibles (বিশেষ টাইপ): স্বাস্থ্য, বায়োমেট্রিক, রাজনৈতিক এবং বিশ্বাসের রেকর্ড। যোগ করা নিয়ন্ত্রণ সহ আলাদা করুন। ৪. Données comportementales (ব্যবহার রেকর্ড): ব্রাউজ ইতিহাস এবং ব্যবহার প্যাটার্ন। এগুলো একত্রিত করুন বা মাস্ক করুন। ৫. Données inférées (অনুমানকৃত বৈশিষ্ট্য): ব্যবহার থেকে AI-প্রাপ্ত সংকেত। উদ্দেশ্যের সীমা প্রয়োগ করুন। ৬. Données relatives aux mineurs (শিশুদের রেকর্ড): ১৫ বছরের কম ব্যক্তিদের সাথে সংযুক্ত যেকোনো রেকর্ড। বয়স চেক চালান এবং শক্তিশালী স্ক্রাবিং ব্যবহার করুন।
স্ক্র্যাপ করা কন্টেন্টে প্রশিক্ষিত LLM ব্যবহার করছেন? আপনার লিখিত প্রমাণ দরকার। দেখান যে আপনার প্রশিক্ষণ রেকর্ডগুলো পর্যালোচনা এবং স্ক্রাব করা হয়েছে। সুযোগের বিবরণের জন্য আমাদের GDPR সম্মতি গাইড দেখুন।
বেনামীকরণ গাইড: মূল নিয়মাবলী
২০২৩ সালের গাইড এই বিষয়ে EU-এর সবচেয়ে বিস্তারিত টেক্সট। এটি নির্ধারণ করে কোনটি সত্যিই বেনাম হিসেবে গণ্য হয়।
অনুমোদিত কৌশল:
- k-anonymity — প্রতিটি রেকর্ড কমপক্ষে k-1 অন্যটির মতো দেখায়
- l-diversity — প্রতিটি গ্রুপের মধ্যে সংবেদনশীল বৈশিষ্ট্য পরিবর্তিত হয়
- Differential privacy — আউটপুট পরিসংখ্যানে নয়েজ যোগ করা
- Pseudonymization — একটি ঝুঁকি-হ্রাসের পদক্ষেপ, সত্যিকারের বেনামীকরণ নয়
প্রয়োজনীয় রেকর্ড:
স্ক্রাবিং ব্যবহার করে প্রতিটি কার্যক্রমের জন্য, CNIL একটি fiche d'anonymisation (বেনামীকরণ রেকর্ড) আশা করে। এতে অবশ্যই থাকতে হবে:
- ব্যবহৃত কৌশল এবং এর মূল সেটিংস (k মান, epsilon মান)
- একটি পুনরায়-শনাক্তকরণ ঝুঁকি চেকের ফলাফল
- যাচাইকরণ পদ্ধতি (পরীক্ষা বা বাহ্যিক পর্যালোচনা)
- দায়িত্বশীল ব্যক্তি এবং পর্যালোচনার তারিখ
পুনরায়-শনাক্তকরণ ঝুঁকি চেক:
রেকর্ডগুলো বেনাম হিসেবে চিহ্নিত করার আগে একটি আনুষ্ঠানিক চেক করুন। জিজ্ঞাসা করুন: একজন অনুপ্রাণিত ব্যক্তি কি এটি পুনরায় শনাক্ত করতে পারবে? কোন সহায়ক ডেটাসেট বিদ্যমান তা দেখুন। সম্পূর্ণ প্রসঙ্গ বিবেচনা করুন।
ফরাসি PII: আপনার টুলগুলোকে কী খুঁজে বের করতে হবে
ফরাসি নিয়মগুলো ফরাসি-ভাষার PII কভারেজ প্রয়োজন। আপনার টুলগুলোকে ফরাসি-নির্দিষ্ট ID টাইপ সনাক্ত করতে হবে।
কভার করার মূল ID:
- NIR: ১৫ সংখ্যা (১৩ বেস + ২-সংখ্যার কী)। এটি ফরাসি সামাজিক নিরাপত্তা নম্বর।
- Carte vitale নম্বর: স্বাস্থ্য বীমা কার্ড ID।
- SIRET/SIREN: ব্যক্তিগত ফাইলে পাওয়া ব্যবসায়িক ID।
- Numéro d'ordre professionnel: ডাক্তার, আইনজীবী এবং অ্যাকাউন্ট্যান্টদের জন্য রেজিস্ট্রি নম্বর।
- CNI (Carte nationale d'identité): ফরাসি জাতীয় পরিচয়পত্র নম্বর।
ফরাসি NER মডেলগুলোকে ফরাসি নামের প্যাটার্ন পরিচালনা করতে হবে। এগুলোর মধ্যে রয়েছে যৌগিক নাম (Jean-Pierre), কণিকা (de, du, des) এবং হাইফেনযুক্ত উপাধি। সব লোকেল কীভাবে কভার করবেন তা দেখতে আমাদের বহুভাষিক PII সনাক্তকরণ গাইড দেখুন।
এনফোর্সমেন্ট: কোন বিষয়ে জরিমানা হয়
সংস্থার জরিমানা একটি স্পষ্ট প্যাটার্ন অনুসরণ করে। এগুলো অনুপস্থিত প্রযুক্তিগত নিয়ন্ত্রণকে লক্ষ্য করে। শুধু খারাপ প্রক্রিয়া খুব কমই প্রধান সমস্যা।
Clearview AI — €২০M জরিমানা (২০২২): ফার্মটি কোনো আইনি ভিত্তি ছাড়াই ফরাসি মানুষের বায়োমেট্রিক রেকর্ড প্রক্রিয়া করেছিল। রেকর্ডগুলো সরকারি ওয়েব উৎস থেকে স্ক্র্যাপ করা হয়েছিল। মামলাটি নিশ্চিত করেছে: AI প্রশিক্ষণের জন্য বাল্ক ওয়েব-স্ক্র্যাপিংয়ের জন্য একটি স্পষ্ট আইনি ভিত্তি প্রয়োজন।
TikTok — তদন্ত শুরু: ফরাসি ব্যবহারকারীদের তথ্য চীনে স্থানান্তর সংক্রান্ত উদ্বেগের কারণে। এটি সীমান্ত পার হওয়া স্থানান্তর নিয়মের ক্রমাগত প্রাসঙ্গিকতা দেখায়।
অ্যামাজন — €৩৫M জরিমানা (২০২২): ব্যক্তিগতকৃত বিজ্ঞাপন থেকে অপ্ট-আউট করা কঠিন ছিল। কুকি সম্মতি নিয়ম লঙ্ঘন করেছে।
CNIL সম্মতির ব্যবহারিক পদক্ষেপ
আপনার AI পাইপলাইন ম্যাপ করুন। ফরাসি ব্যক্তিগত তথ্য কোথায় প্রবেশ করে সেই প্রতিটি পয়েন্ট চিহ্নিত করুন। প্রতিটি প্রবাহ নথিভুক্ত করুন।
প্রতিটি তথ্য টাইপের জন্য বেনামীকরণ রেকর্ড তৈরি করুন। একটি fiche d'anonymisation সহ ছয়টি বিভাগের প্রতিটির জন্য প্রস্তুত থাকুন।
ফরাসি এনটিটি সনাক্তকরণ যাচাই করুন। আপনার সনাক্তকরণ সিস্টেম NIR, Carte vitale নম্বর, SIRET এবং CNI নম্বর ধরে কিনা পরীক্ষা করুন।
আপনার পুনরায়-শনাক্তকরণ ঝুঁকি মূল্যায়ন নথিভুক্ত করুন। CNIL পরিদর্শকরা দেখতে চান যে ঝুঁকি মূল্যায়ন বেনামীকরণ সিদ্ধান্তের আগে চালানো হয়েছে।
কেন্দ্রীয় অডিট লগ বজায় রাখুন। সম্মতি প্রদর্শনের জন্য প্রক্রিয়াকরণ রেকর্ড তাৎক্ষণিকভাবে উপলব্ধ করুন।