HIPAA पहचान रहित करना बिना Regex पीएचडी: एआई-सहायता प्राप्त MRN पैटर्न निर्माण
आपके अस्पताल का मेडिकल रिकॉर्ड नंबर प्रारूप किसी भी मानक PII उपकरण में मौजूद नहीं है। यहाँ बताया गया है कि इसे 5 मिनट में बिना एक भी लाइन regex लिखे कैसे जोड़ा जाए।
स्वास्थ्य देखभाल आईटी टीमें जो HIPAA पहचान रहित करने का कार्यान्वयन कर रही हैं, उन्हें एक विशिष्ट चुनौती का सामना करना पड़ता है जो अन्य क्षेत्रों में मौजूद नहीं है: पहचानकर्ता जिसे उन्हें सबसे अधिक पहचानने की आवश्यकता होती है - मेडिकल रिकॉर्ड नंबर - उनके अपने संस्थान द्वारा परिभाषित किया गया है, किसी भी राष्ट्रीय मानक द्वारा नहीं।
परिणाम: स्वास्थ्य देखभाल प्रणाली में HIPAA पहचान रहित करने का प्रत्येक कार्यान्वयन कस्टम कॉन्फ़िगरेशन की आवश्यकता करता है। बिना कस्टम कॉन्फ़िगरेशन के, MRNs "पहचान रहित" डेटा सेट के माध्यम से बिना पहचान के गुजरते हैं।
मल्टी-फैसिलिटी MRN अराजकता
वर्षों की अधिग्रहण के माध्यम से निर्मित स्वास्थ्य देखभाल नेटवर्क में ऐसे सुविधाएं शामिल हैं जिनमें विरासती EHR सिस्टम हैं - प्रत्येक का अपना MRN प्रारूप है जो दशकों पहले स्थापित किया गया था:
- मेमोरियल अस्पताल (2015 से एपिक): MRN:XXXXXXX (7-अंकात्मक संख्या पूर्ववर्ती के साथ)
- सेंट मैरी (विरासती सर्नर सिस्टम): PT-YYYYY (5-अंकात्मक रोगी पूर्ववर्ती के साथ)
- विश्वविद्यालय अस्पताल (Meditech 6.0): UHN-XXXXXXXXXX (10-चरित्र अल्फ़ान्यूमेरिक)
- संबद्ध क्लिनिक (स्वतंत्र EMR): Cd{5} (C के बाद 5 अंक)
HIPAA सुरक्षित आश्रय सभी 18 पहचानकर्ता श्रेणियों को हटाने की आवश्यकता होती है, जिसमें "मेडिकल रिकॉर्ड नंबर" (श्रेणी 8) शामिल है। एक पहचान रहित उपकरण जो इन प्रारूपों को नहीं जानता है, उन्हें पूरी तरह से चूक जाता है। "पहचान रहित" डेटा सेट में सभी चार सुविधा प्रारूपों के लिए सभी MRNs शामिल हैं।
ServiceNow का स्वास्थ्य देखभाल समुदाय विशेष रूप से इस दर्द बिंदु को दस्तावेज करता है: स्वास्थ्य देखभाल आईटी टीमें जो HR कार्य नोट्स से PHI की पहचान करने का प्रयास कर रही हैं, पाती हैं कि मानक Presidio कॉन्फ़िगरेशन SSNs और फोन नंबरों का पता लगाते हैं जबकि पूरी तरह से सुविधा-विशिष्ट MRNs को चूक जाते हैं।
Regex बाधा
Microsoft Presidio (कई HIPAA उपकरणों के लिए ओपन-सोर्स आधार) में कस्टम पहचानकर्ताओं का निर्माण करने के लिए आवश्यक है:
- PatternRecognizer वर्ग को समझना
- Python सिंटैक्स में regex पैटर्न लिखना
- पहचानकर्ता पंजीकरण के लिए YAML फ़ाइलों को कॉन्फ़िगर करना
- आत्मविश्वास स्कोर और संदर्भ शब्दों को समझना
- Python स्क्रिप्ट के साथ परीक्षण करना
- विफल पहचानकर्ताओं को डिबग करना
Python पृष्ठभूमि के बिना स्वास्थ्य देखभाल आईटी पेशेवरों के लिए, यह एक महत्वपूर्ण तकनीकी बाधा बनाता है। एक अनुपालन अधिकारी जो ठीक जानता है कि MRN:XXXXXXX प्रारूप क्या है, वह या तो Python सीखने के बिना या इंजीनियरिंग टिकट की प्रतीक्षा किए बिना Presidio पहचानकर्ता को कॉन्फ़िगर नहीं कर सकता।
आम परिणाम: अनुपालन अंतर खुला रहता है जबकि इंजीनियरिंग टिकट 6-8 सप्ताह की कतार में बैठा रहता है।
एआई-सहायता प्राप्त पैटर्न निर्माण
वैकल्पिक: पैटर्न को सामान्य भाषा में वर्णित करें, एक कार्यशील regex प्राप्त करें।
प्रक्रिया:
- कस्टम एंटिटी बिल्डर खोलें
- उदाहरण प्रदान करें: "ये हमारे सिस्टम से MRN नंबर की तरह दिखते हैं: MRN:1234567, MRN:9876543, MRN:0001234"
- एआई पैटर्न उत्पन्न करता है: MRN:d{7}
- 10 नमूना डिस्चार्ज सारांशों के खिलाफ परीक्षण करें
- सभी MRNs का पता चला? सहेजें और लागू करें।
चार MRN प्रारूपों के साथ मल्टी-फैसिलिटी नेटवर्क के लिए:
- मेमोरियल अस्पताल: प्रारूप का वर्णन करें → MRN:d{7}
- सेंट मैरी: प्रारूप का वर्णन करें → PT-d{5}
- विश्वविद्यालय अस्पताल: प्रारूप का वर्णन करें → UHN-[A-Z0-9]{10}
- संबद्ध क्लिनिक: प्रारूप का वर्णन करें → Cd{5}
चार कस्टम एंटिटीज़ बनाएं, "नेटवर्क MRN पहचान" प्रीसेट में समूहित करें, सभी दस्तावेज़ प्रसंस्करण पर लागू करें। कुल समय: अनुपालन अधिकारी के काम का एक दोपहर।
सुरक्षित आश्रय प्रमाणन के लिए मान्यता
HIPAA का सुरक्षित आश्रय विधि आवश्यक है कि कवर की गई संस्था "इस जानकारी के बारे में वास्तविक ज्ञान नहीं रखती है कि इसे अकेले या अन्य जानकारी के साथ मिलाकर किसी व्यक्ति की पहचान के लिए उपयोग किया जा सकता है।"
कस्टम एंटिटी-आधारित पहचान के लिए, मान्यता पूर्णता को प्रदर्शित करती है:
चरण 1: नमूना निष्कर्षण प्रत्येक सुविधा प्रकार से 100 डिस्चार्ज सारांश निकालें। रोगी जनसंख्या, विभागों और समय अवधि को मिलाएं।
चरण 2: स्वचालित प्रसंस्करण 400 दस्तावेज़ों को कस्टम एंटिटी पहचान के माध्यम से चलाएं।
चरण 3: मानव मान्यता नमूना 20 संसाधित दस्तावेज़ों की मैन्युअल समीक्षा करें (5% नमूना)। देखें:
- कोई भी स्ट्रिंग जो MRNs की तरह दिखती है लेकिन पहचान नहीं की गई (झूठी नकारात्मक)
- कोई भी गैर-MRN स्ट्रिंग जो गलत तरीके से चिह्नित की गई (झूठी सकारात्मक)
चरण 4: पैटर्न परिष्करण यदि झूठी नकारात्मक पाई जाती हैं: पैटर्न को परिष्कृत करें या संदर्भ मिलान जोड़ें। यदि झूठी सकारात्मक संख्या में हैं: शब्द सीमा प्रतिबंध या संदर्भ मान्यता जोड़ें।
चरण 5: दस्तावेज़ीकरण रिकॉर्ड करें: कस्टम एंटिटी परिभाषा, मान्यता नमूना आकार, मान्यता परिणाम, और मान्यता की तारीख। यह दस्तावेज़ सुरक्षित आश्रय प्रमाणन का समर्थन करता है।
MRNs से परे: पूर्ण HIPAA सुरक्षित आश्रय कवरेज
MRN पहचान के अंतर को संबोधित करने के बाद, सभी 18 सुरक्षित आश्रय श्रेणियों की पूर्णता की समीक्षा करें:
| श्रेणी | मानक पहचान | कस्टम की आवश्यकता? |
|---|---|---|
| 1. नाम | ✓ NER मॉडल | नहीं |
| 2. भौगोलिक डेटा | ✓ स्थान पहचान | राज्य के लिए नहीं; सुविधा-विशिष्ट कोड के लिए हाँ |
| 3. तिथियाँ | ✓ तिथि पहचान | नहीं |
| 4. फोन नंबर | ✓ फोन पहचान | नहीं |
| 5. फैक्स नंबर | ✓ फोन पहचान | नहीं |
| 6. ईमेल पते | ✓ ईमेल पहचान | नहीं |
| 7. SSNs | ✓ SSN पहचान | नहीं |
| 8. मेडिकल रिकॉर्ड नंबर | ✗ डिफ़ॉल्ट में नहीं | हाँ - संस्थान-विशिष्ट |
| 9. स्वास्थ्य योजना लाभार्थी नंबर | आंशिक | अक्सर हाँ - वाहक-विशिष्ट |
| 10. खाता नंबर | आंशिक | अक्सर हाँ - बिलिंग खाता प्रारूप |
| 11. प्रमाण पत्र/लाइसेंस नंबर | आंशिक | अक्सर हाँ - DEA + राज्य-विशिष्ट |
| 12. वाहन पहचानकर्ता | आंशिक | नैदानिक दस्तावेज़ों में शायद ही कभी |
| 13. उपकरण पहचानकर्ता | आंशिक | हाँ यदि चिकित्सा उपकरण दस्तावेजित हैं |
| 14. वेब यूआरएल | ✓ यूआरएल पहचान | नहीं |
| 15. आईपी पते | ✓ आईपी पहचान | नहीं |
| 16. बायोमेट्रिक पहचानकर्ता | ✗ पाठ संदर्भ | डिस्चार्ज सारांश में शायद ही कभी |
| 17. पूर्ण-चेहरे की तस्वीरें | ✗ केवल छवि | पाठ प्रसंस्करण के लिए दायरे से बाहर |
| 18. अन्य अद्वितीय पहचानकर्ता | ✗ डिफ़ॉल्ट में नहीं | हाँ - संस्थान-विशिष्ट |
क्लिनिकल टेक्स्ट प्रसंस्करण के लिए, श्रेणियाँ 8, 9, 10, और 18 सबसे सामान्यतः कस्टम एंटिटी जोड़ने की आवश्यकता होती हैं।
क्लिनिकल दस्तावेज़ीकरण संदर्भ
डिस्चार्ज सारांश, क्लिनिकल नोट्स, और ऑपरेटिव रिपोर्ट मुख्य दस्तावेज़ हैं जिन्हें अनुसंधान साझा करने के लिए HIPAA पहचान रहित करने की आवश्यकता होती है। इन दस्तावेज़ों में शामिल हैं:
- हेडर और फुटर में MRNs
- बिलिंग अनुभागों में खाता नंबर
- पूरे में तिथियाँ (प्रवेश, प्रक्रियाएँ, प्रयोगशालाएँ, दवाएँ)
- चिकित्सक के नाम और DEA नंबर
- संदर्भित चिकित्सक की जानकारी
- बीमा सदस्य आईडी
संस्थान-विशिष्ट प्रारूपों (MRNs, खाता नंबर) के लिए कस्टम एंटिटी पहचान को सार्वभौमिक प्रारूपों (तिथियाँ, नाम, फोन नंबर) के लिए मानक पहचान के साथ मिलाकर वह पूर्ण कवरेज प्रदान करता है जो HIPAA सुरक्षित आश्रय की आवश्यकता है।
निष्कर्ष
कस्टम एंटिटी कॉन्फ़िगरेशन के बिना HIPAA पहचान रहित करना HIPAA सुरक्षित आश्रय पहचान रहित करना नहीं है। हर स्वास्थ्य देखभाल संस्थान का MRN प्रारूप अद्वितीय होता है। मानक PII उपकरण उन्हें चूक जाते हैं। अनुपालन टीमें इस अंतर को बंद करने के लिए इंजीनियरिंग कतारों के लिए इंतजार नहीं कर सकतीं।
एआई-सहायता प्राप्त पैटर्न निर्माण अनुपालन अंतर को 6-8 सप्ताह के इंजीनियरिंग समय से अनुपालन अधिकारी के काम के एक दोपहर में संकुचित करता है। प्रारूप का वर्णन करें, नमूनों के खिलाफ मान्यता करें, उत्पादन में लागू करें।
स्रोत: