ডেনমার্ক CPR নম্বর: GDPR সম্মতি গাইড
২০২৬ সালের জন্য আপডেট করা হয়েছে
ডেনমার্কের ডেটা নজরদারি সংস্থা Datatilsynet ২০২৪ সালে ৩১টি GDPR সিদ্ধান্ত জারি করেছে। চৌদ্দটিতে স্বাস্থ্যসেবা ডেটা জড়িত ছিল। এই উচ্চ অনুপাত দুটি তথ্য প্রতিফলিত করে: ডেনমার্ক একটি বড় জাতীয় স্বাস্থ্য ব্যবস্থা পরিচালনা করে, এবং সেই সিস্টেমে প্রযুক্তিগত ব্যবধান রোগীর রেকর্ড উন্মুক্ত করতে থাকে।
CPR নম্বরের জন্য চেক-ডিজিট নিয়ম
CPR নম্বর হলো ডেনমার্কের ব্যক্তিগত আইডি। এটি DDMMYY-XXXX ফরম্যাটে ১০টি সংখ্যা। প্রথম ছয়টি সংখ্যা জন্মতারিখ। শেষ চারটি একটি কোড এবং একটি চেক ডিজিট।
চেক ডিজিট মডুলাস-১১ নিয়ম ব্যবহার করে:
- সংখ্যা ১ থেকে ৯ নিন।
- প্রতিটিকে একটি ওজন দিন: ৪, ৩, ২, ৭, ৬, ৫, ৪, ৩, ২।
- প্রতিটি সংখ্যাকে তার ওজন দিয়ে গুণ করুন। সমস্ত ফলাফল যোগ করুন।
- ১১ দিয়ে ভাগ করুন। ভাগশেষ নোট করুন।
- ভাগশেষ ০ → চেক ডিজিট হলো ০।
- ভাগশেষ ১ → নম্বরটি বৈধ নয়।
- ভাগশেষ ২–১০ → চেক ডিজিট হলো ১১ বিয়োগ ভাগশেষ।
CPR নম্বর স্ক্যান করা যেকোনো সরঞ্জামের জন্য এই নিয়ম গুরুত্বপূর্ণ। কিছু DDMMYY-XXXX স্ট্রিং কখনও বৈধ হতে পারে না। এই পদক্ষেপ এড়িয়ে যাওয়া সরঞ্জামগুলি তারিখ, চালান কোড এবং রেফারেন্স নম্বরকে বাস্তব আইডি হিসেবে চিহ্নিত করে।
কর্তৃপক্ষের ২০২৪ পর্যালোচনা দেখেছে যে ৬৭% সাধারণ NLP সরঞ্জাম এই যাচাই এড়িয়ে যায়। সেই ব্যবধান এর স্বাস্থ্যসেবা মামলায় শীর্ষ প্রযুক্তিগত ব্যর্থতা।
ডেনমার্কের পাঁচটি স্বাস্থ্য রেজিস্ট্রি
ডেনমার্ক পাঁচটি জাতীয় রেজিস্ট্রি জুড়ে স্বাস্থ্য ডেটা সংযুক্ত করে। ব্যক্তিগত আইডি পাঁচটিকে একসাথে বাঁধে।
- হাসপাতাল ডিসচার্জ রেকর্ড (১৯৭৭ সাল থেকে)
- প্রেসক্রিপশন ডেটা (১৯৯৫ সাল থেকে)
- ক্যান্সার রেজিস্ট্রি (১৯৪৩ সাল থেকে)
- মৃত্যুর কারণ রেজিস্ট্রি (১৯৭০ সাল থেকে)
- প্রাথমিক যত্নের রোগনির্ণয় (১৯৯০ সাল থেকে)
এটি ডেনিশ স্বাস্থ্য গবেষণাকে খুব শক্তিশালী করে তোলে। এটি একটি ঝুঁকিও তৈরি করে। কাঁচা আইডি সরিয়ে নেওয়া যথেষ্ট নয়। এমন একটি ডেটাসেট যা এখনও বয়স, লিঙ্গ, রোগনির্ণয়, এবং বছর ধারণ করে মানুষকে পুনরায় উন্মুক্ত করতে পারে — বিশেষত বিরল রোগ আছে তাদের।
দ্বিতীয় স্বাস্থ্য ডেটা ব্যবহারে Datatilsynet-এর ২০২৪ নির্দেশিকা তিনটি প্রয়োজনীয়তা নির্ধারণ করে।
ডেটায় কী করেছেন তা লিখে রাখুন: আপনি কোন ক্ষেত্র সরিয়েছেন, কোনটি গোল করেছেন বা গোষ্ঠীবদ্ধ করেছেন, এবং আউটপুট কী গোষ্ঠীর আকার অর্জন করেছে তা তালিকাভুক্ত করুন। একটি নীতি নোট এই মানদণ্ড পূরণ করে না।
বড় সেটের জন্য বাইরের পর্যালোচনা নিন: ৫,০০০-এরও বেশি মানুষ সহ ডেটাসেটের জন্য, কর্তৃপক্ষ ডি-আইডেন্টিফিকেশন পদক্ষেপের একটি স্বাধীন প্রযুক্তিগত পর্যালোচনার সুপারিশ করে।
ডেটাকে প্রশ্নের সাথে মেলান: ডেটাসেটটি অবশ্যই উল্লিখিত গবেষণা লক্ষ্যের সাথে মানানসই হতে হবে। কর্তৃপক্ষ এমন ক্ষেত্র খুঁজে পেয়েছে যেখানে দলগুলি পূর্ণ জাতীয় রেজিস্ট্রি ব্যবহার করেছে যখন একটি ছোট নমুনা কাজ করত।
চেক-ডিজিট নিয়মগুলি অন্যান্য ইউরোপীয় আইডি ফরম্যাটে কীভাবে প্রযোজ্য তার জন্য আমাদের EU জাতীয় আইডি সনাক্তকরণ গাইড দেখুন।
২০২৪ মামলায় কী পাওয়া গেছে
১৪টি স্বাস্থ্যসেবা মামলা তিনটি সাধারণ ব্যর্থতার ধরন ভাগ করে।
গবেষণা ডেটা শেয়ারিং: একটি হাসপাতাল AI প্রশিক্ষণের জন্য একটি একাডেমিক অংশীদারের কাছে একটি ডি-আইডেন্টিফাইড রোগী ডেটাসেট পাঠায়। সেটে জন্মতারিখের অংশ, রোগনির্ণয় কোড, এবং চিকিৎসার তারিখ রয়েছে। কর্তৃপক্ষ দেখেছে এই মিশ্রণ বিরল রোগের রোগীদের পুনরায় উন্মুক্ত করে। অস্বাভাবিক রোগনির্ণয় দ্রুত পুলকে সংকুচিত করে।
তৃতীয়-পক্ষ AI পরিষেবা: একটি স্বাস্থ্য প্রযুক্তি সংস্থা ক্লিনিকাল রেকর্ড কাজের জন্য একটি মার্কিন-ভিত্তিক AI পরিষেবায় রোগীর নোট পাঠায়। সেই নোটের ব্যক্তিগত আইডি আগে সরানো হয়নি। কোনো বৈধ ট্রান্সফার মেকানিজম নেই।
OCR পাইপলাইনের ব্যবধান: একটি বীমাকারী অক্ষমতার দাবির জন্য স্ক্যান করা PDF ফর্ম প্রক্রিয়া করে। এর OCR সরঞ্জাম ছবিগুলি পাঠ্যে রূপান্তরিত করে। কিন্তু আউটপুটে চেক-ডিজিট পরীক্ষা চালায় না। অনেক আইডি মিস হয়।
OCR প্রায়ই মাঝখানে স্থান ঢোকায় বা ড্যাশ সরায়। সরল প্যাটার্ন ম্যাচিং সেই আউটপুটে ভেঙে পড়ে। সনাক্তকরণ অবশ্যই OCR পাঠ্যে কাজ করতে হবে, শুধু পরিষ্কার ইনপুটে নয়। স্ক্যান করা নথি পরিচালনার পদক্ষেপের জন্য আমাদের OCR স্বাস্থ্যসেবা সনাক্তকরণ গাইড দেখুন।
তিনটি প্রযুক্তিগত অবশ্যই
এই তিনটি উপাদান ডেনিশ স্বাস্থ্যসেবা GDPR সম্মতির ভিত্তি গঠন করে।
সমস্ত পাঠ্যে চেক-ডিজিট পরীক্ষা: পরিষ্কার পাঠ্য এবং OCR আউটপুট উভয়ে প্রতিটি প্রার্থী স্ট্রিংয়ে সম্পূর্ণ মডুলাস-১১ যাচাই চালান।
ডেনিশ-ভাষা নাম সনাক্তকরণ: ডেনিশ পাঠ্যে প্রশিক্ষিত একটি মডেল ব্যবহার করুন। spaCy da_core_news মডেল একটি বিকল্প। একটি সাধারণ ইংরেজি মডেল ডেনিশ নাম এবং সংগঠন নাম মিস করে।
ডি-আইডেন্টিফিকেশন রেকর্ড: কী সরানো হয়েছে, কী গোষ্ঠীবদ্ধ হয়েছে, এবং আউটপুটের গোষ্ঠী আকার লিখে রাখুন। কর্তৃপক্ষ এটি প্রযুক্তিগত আকারে চায়, একটি নীতি নোট হিসেবে নয়।
স্বাস্থ্যসেবা ডেটা ঘটনার খরচের ডেটার জন্য, আমাদের স্বাস্থ্যসেবা লঙ্ঘনের খরচ বিশ্লেষণ দেখুন।