Garante ইতালি: GDPR এবং PII প্রযুক্তিগত সম্মতি
আপডেট: ২০২৬
ইতালির সবচেয়ে সক্রিয় গোপনীয়তা নিয়ন্ত্রক
Garante per la protezione dei dati personali হলো ইতালির ডেটা কর্তৃপক্ষ। এটি EU-র সবচেয়ে সক্রিয় AI নিয়ন্ত্রক।
দুটি পদক্ষেপ এর পদ্ধতি নির্ধারণ করে। মার্চ ২০২৩ সালে, Garante OpenAI-কে ইতালির ব্যবহারকারীদের জন্য ChatGPT বন্ধ করতে বলেছিল। এটি ডেটা ব্যবহারের জন্য কোনো বৈধ আইনি ভিত্তি খুঁজে পায়নি। এটি অপ্রাপ্তবয়স্কদের জন্য কোনো বয়স পরীক্ষাও পায়নি। OpenAI বয়স নিয়ন্ত্রণ, একটি প্রশিক্ষণ অপ্ট-আউট এবং ইতালীয়তে একটি গোপনীয়তা নোটিশ যোগ করেছে। পরিষেবা এপ্রিল ২০২৩ সালে ফিরে এসেছিল।
ডিসেম্বর ২০২৪ সালে, কর্তৃপক্ষ OpenAI-কে €১৫ মিলিয়ন জরিমানা করে। তিনটি জিনিস জরিমানার কারণ ছিল: কোনো বৈধ আইনি ভিত্তি নেই, প্রশিক্ষণ ব্যবহার সম্পর্কে কোনো স্পষ্ট নোটিশ নেই এবং অপ্রাপ্তবয়স্কদের জন্য কোনো বয়স পরীক্ষা নেই।
ইতালির ব্যবহারকারীদের ব্যক্তিগত ডেটা পরিচালনাকারী যেকোনো AI সরঞ্জামকে এই একই মান পূরণ করতে হবে।
OpenAI মামলায় কী ব্যর্থ হয়েছিল
€১৫ মিলিয়ন জরিমানা নির্দিষ্ট ফাঁক নামকরণ করেছে। প্রতিটি একটি অনুপস্থিত প্রযুক্তিগত নিয়ন্ত্রণে মানচিত্র করে।
প্রশিক্ষণ ডেটার আইনি ভিত্তি: Garante ব্যবহারকারীর ডেটায় প্রশিক্ষণের ভিত্তি হিসেবে "বৈধ স্বার্থ" প্রত্যাখ্যান করেছে। ব্যক্তিগত ডেটায় AI প্রশিক্ষণের জন্য স্পষ্ট সম্মতি বা একটি চুক্তির ভিত্তি প্রয়োজন। শুধুমাত্র "বৈধ স্বার্থ" দাবি পাস হয় না।
স্বচ্ছতা: ব্যবহারকারীদের বলা হয়নি কীভাবে তাদের ডেটা প্রশিক্ষণের জন্য ব্যবহার করা হয়েছিল। তাদের কোনো স্পষ্ট অপ্ট-আউট ছিল না।
বয়স যাচাইকরণ: অপ্রাপ্তবয়স্করা কোনো বয়স পরীক্ষা ছাড়াই ChatGPT অ্যাক্সেস করতে পারত। Garante ভোক্তা AI সরঞ্জামের জন্য এটিকে একটি কঠোর নিয়ম হিসাবে বিবেচনা করে।
মূল প্রভাব: ইতালিতে ব্যবহারকারীর ইনপুট গ্রহণকারী যেকোনো AI সিস্টেমে একটি নথিভুক্ত GDPR আইনি ভিত্তি থাকতে হবে। "বৈধ স্বার্থ" উচ্চ ঝুঁকি।
ইতালীয় জাতীয় শনাক্তকারী
ইতালির অনন্য আইডি ফরম্যাট রয়েছে। সাধারণ সরঞ্জাম প্রায়ই সেগুলো মিস করে। আপনার সনাক্তকরণ স্ট্যাককে তিনটিই কভার করতে হবে।
Codice Fiscale
Codice fiscale হলো একটি ১৬-অক্ষরের জাতীয় আইডি। এটি উপাধির শব্দ, নামের শব্দ, জন্মতারিখ, লিঙ্গ এবং জন্মশহর এনকোড করে। শেষ অক্ষরটি একটি চেক ডিজিট।
২০২৪ সালের Garante প্রযুক্তিগত বিশ্লেষণ দেখেছে যে সাধারণ NLP সরঞ্জাম মাত্র ৬৭% সময় codice fiscale ধরে। প্রধান ব্যর্থতা: সরঞ্জামগুলো ১৬-অক্ষরের প্যাটার্ন মেলায় কিন্তু চেক ডিজিট লজিক এড়িয়ে যায়। তারপর মিথ্যা ইতিবাচক তৈরি করে। নাম-এনকোডিং নিয়ম এড়িয়ে যাওয়া সরঞ্জামগুলিও বিদ্যমান কোড যাচাই করতে পারে না।
ভালো সনাক্তকরণে তিনটি জিনিস প্রয়োজন:
- সম্পূর্ণ চেক অক্ষর অ্যালগরিদম
- উপাধি এবং নামের অক্ষর নিষ্কাশন নিয়ম
- প্রকৃত স্থানীয় ডেটার বিরুদ্ধে পরীক্ষা
Partita IVA
Partita IVA হলো ইতালির ১১-সংখ্যার ব্যবসায়িক VAT নম্বর। শেষ সংখ্যাটি একটি চেক ডিজিট। এটি চালান, চুক্তি এবং ব্যবসায়িক চিঠিতে প্রদর্শিত হয়। আপনার সরঞ্জামকে চেক ডিজিট অ্যালগরিদম চালাতে হবে, শুধুমাত্র ১১-সংখ্যার প্যাটার্ন মেলানো নয়।
Tessera Sanitaria
স্বাস্থ্য কার্ড (tessera sanitaria) তার কোডের একটি অংশ হিসেবে codice fiscale ধারণ করে। স্বাস্থ্য ডেটা GDPR অনুচ্ছেদ ৯-এর অধীনে বিশেষ-শ্রেণী। এটি প্রয়োজনীয় সুরক্ষার স্তর বাড়ায়।
AI সরঞ্জামের জন্য Garante প্রয়োজনীয়তা
Garante-এর নির্দেশিকা তিনটি এলাকা কভার করে।
AI প্রক্রিয়াকরণের আগে: PII খুঁজে পেতে হবে এবং ডেটা AI সিস্টেমে প্রবেশের আগে অপসারণ করতে হবে। ইতালিতে ব্যবহৃত AI সরঞ্জামগুলির জন্য — ব্রাউজার এক্সটেনশন এবং MCP সার্ভার সহ — এর মানে হলো প্রম্পট পাঠানোর আগে codici fiscali, partite IVA এবং স্বাস্থ্য ডেটা স্ট্রিপ করা। এই ধাপ রেকর্ড করার উপায়ের জন্য আমাদের সম্মতি গাইড দেখুন।
AI প্রশিক্ষণের জন্য: স্পষ্ট আইনি ভিত্তি প্রয়োজন। ব্যবহারকারী বিষয়বস্তুতে প্রশিক্ষণের জন্য Garante-এর পছন্দের ভিত্তি হলো সম্মতি। "বৈধ স্বার্থ" একটি লিখিত ভারসাম্য পরীক্ষা প্রয়োজন। সেই পরীক্ষাটি দেখাতে হবে যে প্রশিক্ষণ লক্ষ্য ব্যবহারকারীদের ডেটা অধিকার অপ্রচলিত করে না।
AI আউটপুটের জন্য: বাস্তব ব্যক্তিদের সম্পর্কে বিষয়বস্তু লিখণ সিস্টেমগুলিকে মিথ্যা দাবির ঝুঁকি মোকাবেলা করতে হবে। Garante একটি স্বতন্ত্র ঝুঁকি হিসাবে মিথ্যা ব্যক্তিগত ডেটার নাম দিয়েছে যার একটি প্রযুক্তিগত সমাধান প্রয়োজন।
৬৩% এন্টারপ্রাইজ ফাঁক
২০২৪ সালের Garante জরিপ দেখেছে যে ৬৩% ইতালীয় সংস্থার কোনো GDPR-সমন্বিত AI নীতি নেই। কর্তৃপক্ষ এই ফাঁককে একটি সক্রিয় অডিট ফোকাস করেছে।
প্রযুক্তিগত নিয়ন্ত্রণ ছাড়া একটি নীতি রক্ষা করা কঠিন। Garante এমন সংস্থাগুলিকে টার্গেট করে যারা কর্মীদের ডেটা ব্যবহার স্ব-পুলিশ করার জন্য নির্ভর করে। আমাদের নিরাপত্তা ওভারভিউ দেখায় কীভাবে স্বয়ংক্রিয় নিয়ন্ত্রণ লিখিত নীতিকে সমর্থন করে।
Garante সম্মতির জন্য চারটি নিয়ন্ত্রণ
১. সাবমিশনের আগে PII ফিল্টারিং
কোনো AI মডেলে ইনপুট পৌঁছানোর আগে codice fiscale, partita IVA এবং tessera sanitaria ডেটা সরিয়ে দিন। এটি Garante-এর কেস লজিক দাবি করে মূল প্রযুক্তিগত সমাধান।
২. ইতালীয়-ভাষার NER
ইতালীয় পাঠ্যে প্রশিক্ষিত একটি নামযুক্ত সত্তা মডেল ব্যবহার করুন। উদাহরণস্বরূপ, spaCy it_core_news। সাধারণ ইংরেজি-প্রশিক্ষিত মডেল ইতালীয় নামের প্যাটার্ন মিস করে। মডেল নির্বাচনের জন্য আমাদের বহুভাষিক PII সনাক্তকরণ গাইড দেখুন।
৩. আইনি ভিত্তি ডকুমেন্টেশন
ব্যবহারে প্রতিটি AI সরঞ্জামের জন্য: আইনি ভিত্তি লিখুন। যদি প্রশিক্ষণ জড়িত থাকে, ভারসাম্য পরীক্ষা যোগ করুন। এগুলো এমন জায়গায় সংরক্ষণ করুন যেখানে নিরীক্ষকরা দ্রুত খুঁজে পেতে পারেন।
৪. অডিট ট্রেইল
লগ করুন যে ফিল্টারিং চলেছে, কোন সত্তার ধরনগুলি পাওয়া গেছে এবং কী সরানো হয়েছে। এটি পরিদর্শকদের দীর্ঘ ম্যানুয়াল পর্যালোচনা ছাড়াই প্রয়োজনীয় প্রমাণ দেয়।