HIPAA MRN শনাক্তকরণ — রেগেক্স বিশেষজ্ঞ ছাড়াই
আপনার হাসপাতালের MRN ফরম্যাট কোনো সাধারণ PII টুলে নেই। পাঁচ মিনিটে কীভাবে এটি যোগ করবেন তা এখানে দেওয়া হলো। কোনো কোড লাগবে না।
হেলথকেয়ার IT টিমগুলো একটি HIPAA সমস্যায় পড়ে যা অন্য খাতে নেই। তাদের সবচেয়ে বেশি যে আইডিটি খুঁজে বের করতে হয় — মেডিক্যাল রেকর্ড নম্বর — সেটি তাদের নিজের হাসপাতালই নির্ধারণ করে। কোনো জাতীয় মানদণ্ড নেই।
প্রতিটি HIPAA ডি-আইডেন্টিফিকেশন প্রকল্পে কাস্টম সেটআপ দরকার। ছাড়া, MRN গুলো "ডি-আইডেন্টিফাইড" ফাইলে অলক্ষ্যে থেকে যায়।
মাল্টি-ফ্যাসিলিটি MRN সমস্যা
মার্জারের মাধ্যমে গড়া হাসপাতাল নেটওয়ার্কগুলোতে লেগ্যাসি EHR সিস্টেম থাকে। প্রতিটি সিস্টেমের নিজস্ব MRN ফরম্যাট:
- Memorial Hospital (Epic): MRN:XXXXXXX — প্রিফিক্সসহ ৭-অঙ্কের নম্বর
- St. Mary's (Cerner): PT-YYYYY — পেশেন্ট প্রিফিক্সসহ ৫-অঙ্ক
- University Hospital (Meditech): UHN-XXXXXXXXXX — ১০-অক্ষরের মিশ্রণ
- Clinic (standalone EMR): C\d{5} — C অক্ষর এবং ৫ অঙ্ক
HIPAA Safe Harbor ১৮টি আইডি ধরন সরানো বাধ্যতামূলক করে। বিভাগ ৮ হলো মেডিক্যাল রেকর্ড নম্বর। যে টুল আপনার ফরম্যাট জানে না সে সেগুলো মিস করবে। ফাইলটি পরিষ্কার দেখায়। কিন্তু তা নয়।
ServiceNow হেলথকেয়ার কমিউনিটি এই একই সমস্যা উল্লেখ করেছে। সাধারণ টুলগুলো SSN এবং ফোন নম্বর ধরে। তারা প্রতিবারই ফ্যাসিলিটি MRN মিস করে।
রেগেক্সের বাধা
Microsoft Presidio — অনেক HIPAA টুলের ওপেন-সোর্স ভিত্তি — এ কাস্টম নিয়ম যোগ করতে সত্যিকারের দক্ষতা লাগে:
- আপনাকে PatternRecognizer ক্লাস জানতে হবে
- Python সিনট্যাক্সে রেগেক্স লিখতে হবে
- YAML কনফিগ ফাইল সেটআপ করতে হবে
- কনফিডেন্স স্কোর টিউন করতে হবে
- Python স্ক্রিপ্ট পরীক্ষা ও ডিবাগ করতে হবে
যে কমপ্লায়েন্স অফিসার MRN ফরম্যাট জানেন তিনি একা এটি করতে পারবেন না। সমাধানটি ইঞ্জিনিয়ারিং টিকেটে পরিণত হয়। ৬-৮ সপ্তাহ কিউতে বসে থাকে। ফাঁক খোলা থাকে।
AI-সহায়তা প্যাটার্ন তৈরি
একটি দ্রুত পদ্ধতি আছে। সাধারণ ভাষায় প্যাটার্ন বর্ণনা করুন। একটি কার্যকর রেগেক্স ফিরে পান।
ধাপসমূহ:
- কাস্টম এন্টিটি বিল্ডার খুলুন
- উদাহরণ দিন: "আমাদের MRN গুলো এরকম: MRN:1234567, MRN:9876543, MRN:0001234"
- AI নিয়ম তৈরি করে: MRN:\d{7}
- ১০টি নমুনা রেকর্ডে পরীক্ষা করুন
- সব MRN পাওয়া গেছে? সংরক্ষণ করুন এবং ডিপ্লয় করুন।
চারটি MRN ফরম্যাটের নেটওয়ার্কের জন্য:
- Memorial Hospital → MRN:\d{7}
- St. Mary's → PT-\d{5}
- University Hospital → UHN-[A-Z0-9]{10}
- Clinic → C\d{5}
চারটি কাস্টম এন্টিটি তৈরি করুন। একটি প্রিসেটে গ্রুপ করুন। সব ফাইলে চালান। সময়: একটি বিকেল।
বিস্তারিত গাইডের জন্য দেখুন custom MRN detection in HIPAA pipelines without code।
Safe Harbor-এর জন্য বৈধতা
HIPAA Safe Harbor বলে কভার্ড এন্টিটির কাছে "প্রকৃত জ্ঞান" থাকা উচিত নয় যে ডেটা কাউকে সনাক্ত করতে পারে। (45 CFR §164.514(b))
বৈধতা দেখায় যে আপনার কাস্টম নিয়মগুলো সব ১৮টি আইডি ধরন কভার করে।
ধাপ ১: নমুনা নিন। প্রতিটি সাইট থেকে ১০০টি রেকর্ড নিন। সময় ও বিভাগ মিশ্রিত করুন।
ধাপ ২: শনাক্তকরণ চালান। আপনার কাস্টম নিয়ম দিয়ে সব ৪০০টি ডকুমেন্ট প্রসেস করুন।
ধাপ ৩: মানব পরীক্ষা। হাতে ২০টি ডকুমেন্ট পর্যালোচনা করুন (৫% নমুনা)। মিস হওয়া MRN এবং ভুল শনাক্তকরণ খুঁজুন।
ধাপ ৪: নিয়ম পরিমার্জন করুন। MRN মিস হচ্ছে? প্যাটার্ন বিস্তৃত করুন। অতিরিক্ত শনাক্তকরণ? শব্দ সীমা যোগ করুন।
ধাপ ৫: লিখে রাখুন। নিয়ম, নমুনার আকার, ফলাফল এবং তারিখ লগ করুন। এই লগই আপনার Safe Harbor রেকর্ড।
কী ডকুমেন্ট করতে হবে তার আরও তথ্যের জন্য দেখুন explainable redaction and HIPAA audit trails।
সম্পূর্ণ Safe Harbor কভারেজ
MRN শনাক্তকরণ ঠিক করার পরে সব ১৮টি বিভাগ পরীক্ষা করুন।
| বিভাগ | সাধারণ টুল | কাস্টম দরকার? |
|---|---|---|
| ১. নাম | NER মডেল | না |
| ২. ভৌগোলিক ডেটা | অবস্থান শনাক্তকরণ | রাজ্যের জন্য না; সাইট কোডের জন্য হ্যাঁ |
| ৩. তারিখ | তারিখ শনাক্তকরণ | না |
| ৪. ফোন নম্বর | ফোন শনাক্তকরণ | না |
| ৫. ফ্যাক্স নম্বর | ফোন শনাক্তকরণ | না |
| ৬. ইমেইল ঠিকানা | ইমেইল শনাক্তকরণ | না |
| ৭. SSN | SSN শনাক্তকরণ | না |
| ৮. মেডিক্যাল রেকর্ড নম্বর | বিল্ট-ইন নেই | হ্যাঁ — সাইট-নির্দিষ্ট |
| ৯. হেলথ প্ল্যান মেম্বার নম্বর | আংশিক | প্রায়ই হ্যাঁ — পেয়ার-নির্দিষ্ট |
| ১০. অ্যাকাউন্ট নম্বর | আংশিক | প্রায়ই হ্যাঁ — বিলিং ফরম্যাট |
| ১১. লাইসেন্স নম্বর | আংশিক | প্রায়ই হ্যাঁ — রাজ্য-নির্দিষ্ট |
| ১২. যানবাহন আইডি | আংশিক | ক্লিনিক্যাল ডকে বিরল |
| ১৩. ডিভাইস আইডি | আংশিক | হ্যাঁ যদি ডিভাইস রেকর্ডে থাকে |
| ১৪. ওয়েব URL | URL শনাক্তকরণ | না |
| ১৫. IP ঠিকানা | IP শনাক্তকরণ | না |
| ১৬. বায়োমেট্রিক আইডি | টেক্সট প্রসঙ্গ | ডিসচার্জ নোটে বিরল |
| ১৭. ছবি | শুধু ইমেজ | টেক্সটের আওতার বাইরে |
| ১৮. অন্যান্য অনন্য আইডি | বিল্ট-ইন নেই | হ্যাঁ — সাইট-নির্দিষ্ট |
ক্লিনিক্যাল টেক্সটের জন্য, বিভাগ ৮, ৯, ১০ এবং ১৮ প্রায়ই কাস্টম সেটআপ প্রয়োজন।
ক্লিনিক্যাল ডকুমেন্ট প্রসঙ্গ
গবেষণার জন্য শেয়ার করা প্রধান ফাইলগুলো হলো ডিসচার্জ নোট, ক্লিনিক্যাল নোট এবং অপারেশন রিপোর্ট। সেগুলোতে থাকে:
- হেডার ও ফুটারে MRN
- বিলিং বিভাগে অ্যাকাউন্ট নম্বর
- সব ঘটনার তারিখ — ভর্তি, পদ্ধতি, ল্যাব, ওষুধ
- চিকিৎসকের নাম এবং DEA নম্বর
- রেফারিং ডাক্তারের তথ্য
- বীমা সদস্য আইডি
সাইট-নির্দিষ্ট ফরম্যাটের কাস্টম নিয়ম এবং সাধারণ ফরম্যাটের বিল্ট-ইন নিয়ম মিলে সম্পূর্ণ Safe Harbor কভারেজ দেয়।
উপসংহার
কাস্টম নিয়ম ছাড়া HIPAA ডি-আইডেন্টিফিকেশন Safe Harbor ডি-আইডেন্টিফিকেশন নয়। প্রতিটি হাসপাতালের MRN ফরম্যাট অনন্য। সাধারণ টুলগুলো সেগুলো মিস করে। কমপ্লায়েন্স ফাঁক বাস্তব এবং আপনি সমাধান না করা পর্যন্ত খোলা থাকে।
AI প্যাটার্ন তৈরি সমাধানকে ৬-৮ সপ্তাহের ইঞ্জিনিয়ারিং থেকে এক বিকেলের কমপ্লায়েন্স কাজে নামিয়ে আনে। ফরম্যাট বর্ণনা করুন। বাস্তব রেকর্ডে পরীক্ষা করুন। ডিপ্লয় করুন। শেষ।