MRN प्रारूप की समस्या
अमेरिका में लगभग 6,100 अस्पताल हैं। हर अस्पताल अपना EHR सिस्टम चलाता है। हर अस्पताल अपना Medical Record Number प्रारूप उपयोग करता है। कोई राष्ट्रीय मानक नहीं है। Joint Commission की मांग है कि अस्पताल मरीजों की पहचान कर सकें — लेकिन यह कोई प्रारूप नियम नहीं बनाता।
प्रारूप बहुत भिन्न होते हैं। कुछ 7-अंकीय पूर्णांक हैं। अन्य 8-अंकीय पूर्णांक हैं। कुछ HOSP-, MRN- या PT- जैसे prefix codes का उपयोग करते हैं। अन्य SVHS- या CHOP- जैसे institution codes जोड़ते हैं। कुछ नंबर में नामांकन वर्ष एम्बेड करते हैं।
HIPAA Safe Harbor 18 में से 8 पहचानकर्ता प्रकार के रूप में रोगी रिकॉर्ड नंबरों को सूचीबद्ध करता है। (45 CFR §164.514(b)(2)) सभी 18 को हटाना होगा। नियम इसे किसी एक प्रारूप तक सीमित नहीं करता। यदि आपका अस्पताल कस्टम प्रारूप उपयोग करता है, तो आपको उसे पहचानना होगा। जो टूल उसे छोड़ देता है वह Safe Harbor में विफल हो जाता है — भले ही वह अन्य 17 प्रकारों को हटा दे।
कोड दृष्टिकोण क्यों विफल होता है
de-identification pipeline में कस्टम रिकॉर्ड नंबर प्रारूप जोड़ने का मानक तरीका Microsoft Presidio को extend करना है। इसका मतलब है Python लिखना।
एक developer EntityRecognizer को extend करने वाली class बनाता है। वे regex लिखते हैं, इसे Presidio की registry में जोड़ते हैं, परीक्षण करते हैं और रखरखाव करते हैं। अनुपालन टीमों के लिए — जो शायद ही कभी कोड करती हैं — यह एक बड़ी बाधा है। हर प्रारूप परिवर्तन के लिए एक engineer की आवश्यकता होती है।
स्वास्थ्य सेवा engineers व्यस्त हैं। वे EHR integration और clinical systems पर ध्यान देते हैं। अनुपालन टूलिंग उनकी प्राथमिकता सूची में आमतौर पर सबसे नीचे होती है।
बिना कोड का पैटर्न वर्कफ़्लो
गाइडेड पैटर्न दृष्टिकोण कोडिंग चरण को हटा देता है।
एक अनुपालन अधिकारी वेब ऐप में Custom Entity Creator खोलता है। वे अपने सिस्टम से पांच नमूना नंबर पेस्ट करते हैं — उदाहरण के लिए:
SVHS-0012345
SVHS-0987654
SVHS-1122334
SVHS-4455667
SVHS-8899001
वे Generate Pattern क्लिक करते हैं। AI संरचना पढ़ता है और लौटाता है:
- Pattern:
SVHS-\d{7} - Confidence: उच्च
- सुझाया गया नाम:
HOSPITAL-MRN - सुझाया गया प्रतिस्थापन:
[MRN]
अधिकारी पांच और नमूने पेस्ट करता है। पैटर्न पास हो जाता है। वे इसे HIPAA preset में सहेजते हैं।
उस बिंदु से, प्रत्येक session — वेब ऐप, Office Add-in, Desktop App और API — इस प्रारूप को मानक PHI pass में पहचानता है। कोई कोड की जरूरत नहीं।
GDPR अनुसंधान नोट
GDPR Article 89 को अनुसंधान datasets के लिए pseudonymization की आवश्यकता है। कस्टम entities institution-specific पहचानकर्ताओं को scope में रखती हैं — वह अंतराल बंद करती हैं जो सामान्य टूल खुला छोड़ते हैं।
आपको क्या मिलता है
यह वर्कफ़्लो एक दोपहर लेता है। कस्टम कोड में हफ्ते लगते हैं।
अनुपालन अधिकारी पैटर्न परिभाषित करता है, परीक्षण करता है और deploy करता है। कोई ticket नहीं। कोई प्रतीक्षा नहीं। preset में मानक 17 Safe Harbor पहचानकर्ताओं के साथ-साथ कस्टम entity होती है।
जब clinical notes का अगला batch चलता है, तो सभी 18 पहचानकर्ता प्रकार कवर होते हैं। Safe Harbor पूर्ण है।
Safe Harbor व्यवहार में कैसे काम करता है, इसके लिए स्वास्थ्य सेवा अनुसंधान के लिए HIPAA Safe Harbor de-identification देखें। अस्पताल-विशिष्ट डिटेक्शन पैटर्न के लिए, engineering के बिना अस्पताल-विशिष्ट MRN प्रारूप पहचानना देखें।