ब्लॉग पर वापस जाएँस्वास्थ्य देखभाल

HIPAA पहचान रहित करना बिना Regex पीएचडी...

हर अस्पताल का MRN प्रारूप अलग होता है। मेमोरियल MRN:XXXXXXX का उपयोग करता है, सेंट मैरी का उपयोग PT-YYYYY करता है...

April 19, 20266 मिनट पढ़ें
HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

HIPAA पहचान रहित करना बिना Regex पीएचडी: एआई-सहायता प्राप्त MRN पैटर्न निर्माण

आपके अस्पताल का मेडिकल रिकॉर्ड नंबर प्रारूप किसी भी मानक PII उपकरण में मौजूद नहीं है। यहाँ बताया गया है कि इसे 5 मिनट में बिना एक भी लाइन regex लिखे कैसे जोड़ा जाए।

स्वास्थ्य देखभाल आईटी टीमें जो HIPAA पहचान रहित करने का कार्यान्वयन कर रही हैं, उन्हें एक विशिष्ट चुनौती का सामना करना पड़ता है जो अन्य क्षेत्रों में मौजूद नहीं है: पहचानकर्ता जिसे उन्हें सबसे अधिक पहचानने की आवश्यकता होती है - मेडिकल रिकॉर्ड नंबर - उनके अपने संस्थान द्वारा परिभाषित किया गया है, किसी भी राष्ट्रीय मानक द्वारा नहीं।

परिणाम: स्वास्थ्य देखभाल प्रणाली में HIPAA पहचान रहित करने का प्रत्येक कार्यान्वयन कस्टम कॉन्फ़िगरेशन की आवश्यकता करता है। बिना कस्टम कॉन्फ़िगरेशन के, MRNs "पहचान रहित" डेटा सेट के माध्यम से बिना पहचान के गुजरते हैं।

मल्टी-फैसिलिटी MRN अराजकता

वर्षों की अधिग्रहण के माध्यम से निर्मित स्वास्थ्य देखभाल नेटवर्क में ऐसे सुविधाएं शामिल हैं जिनमें विरासती EHR सिस्टम हैं - प्रत्येक का अपना MRN प्रारूप है जो दशकों पहले स्थापित किया गया था:

  • मेमोरियल अस्पताल (2015 से एपिक): MRN:XXXXXXX (7-अंकात्मक संख्या पूर्ववर्ती के साथ)
  • सेंट मैरी (विरासती सर्नर सिस्टम): PT-YYYYY (5-अंकात्मक रोगी पूर्ववर्ती के साथ)
  • विश्वविद्यालय अस्पताल (Meditech 6.0): UHN-XXXXXXXXXX (10-चरित्र अल्फ़ान्यूमेरिक)
  • संबद्ध क्लिनिक (स्वतंत्र EMR): Cd{5} (C के बाद 5 अंक)

HIPAA सुरक्षित आश्रय सभी 18 पहचानकर्ता श्रेणियों को हटाने की आवश्यकता होती है, जिसमें "मेडिकल रिकॉर्ड नंबर" (श्रेणी 8) शामिल है। एक पहचान रहित उपकरण जो इन प्रारूपों को नहीं जानता है, उन्हें पूरी तरह से चूक जाता है। "पहचान रहित" डेटा सेट में सभी चार सुविधा प्रारूपों के लिए सभी MRNs शामिल हैं।

ServiceNow का स्वास्थ्य देखभाल समुदाय विशेष रूप से इस दर्द बिंदु को दस्तावेज करता है: स्वास्थ्य देखभाल आईटी टीमें जो HR कार्य नोट्स से PHI की पहचान करने का प्रयास कर रही हैं, पाती हैं कि मानक Presidio कॉन्फ़िगरेशन SSNs और फोन नंबरों का पता लगाते हैं जबकि पूरी तरह से सुविधा-विशिष्ट MRNs को चूक जाते हैं।

Regex बाधा

Microsoft Presidio (कई HIPAA उपकरणों के लिए ओपन-सोर्स आधार) में कस्टम पहचानकर्ताओं का निर्माण करने के लिए आवश्यक है:

  • PatternRecognizer वर्ग को समझना
  • Python सिंटैक्स में regex पैटर्न लिखना
  • पहचानकर्ता पंजीकरण के लिए YAML फ़ाइलों को कॉन्फ़िगर करना
  • आत्मविश्वास स्कोर और संदर्भ शब्दों को समझना
  • Python स्क्रिप्ट के साथ परीक्षण करना
  • विफल पहचानकर्ताओं को डिबग करना

Python पृष्ठभूमि के बिना स्वास्थ्य देखभाल आईटी पेशेवरों के लिए, यह एक महत्वपूर्ण तकनीकी बाधा बनाता है। एक अनुपालन अधिकारी जो ठीक जानता है कि MRN:XXXXXXX प्रारूप क्या है, वह या तो Python सीखने के बिना या इंजीनियरिंग टिकट की प्रतीक्षा किए बिना Presidio पहचानकर्ता को कॉन्फ़िगर नहीं कर सकता।

आम परिणाम: अनुपालन अंतर खुला रहता है जबकि इंजीनियरिंग टिकट 6-8 सप्ताह की कतार में बैठा रहता है।

एआई-सहायता प्राप्त पैटर्न निर्माण

वैकल्पिक: पैटर्न को सामान्य भाषा में वर्णित करें, एक कार्यशील regex प्राप्त करें।

प्रक्रिया:

  1. कस्टम एंटिटी बिल्डर खोलें
  2. उदाहरण प्रदान करें: "ये हमारे सिस्टम से MRN नंबर की तरह दिखते हैं: MRN:1234567, MRN:9876543, MRN:0001234"
  3. एआई पैटर्न उत्पन्न करता है: MRN:d{7}
  4. 10 नमूना डिस्चार्ज सारांशों के खिलाफ परीक्षण करें
  5. सभी MRNs का पता चला? सहेजें और लागू करें।

चार MRN प्रारूपों के साथ मल्टी-फैसिलिटी नेटवर्क के लिए:

  • मेमोरियल अस्पताल: प्रारूप का वर्णन करें → MRN:d{7}
  • सेंट मैरी: प्रारूप का वर्णन करें → PT-d{5}
  • विश्वविद्यालय अस्पताल: प्रारूप का वर्णन करें → UHN-[A-Z0-9]{10}
  • संबद्ध क्लिनिक: प्रारूप का वर्णन करें → Cd{5}

चार कस्टम एंटिटीज़ बनाएं, "नेटवर्क MRN पहचान" प्रीसेट में समूहित करें, सभी दस्तावेज़ प्रसंस्करण पर लागू करें। कुल समय: अनुपालन अधिकारी के काम का एक दोपहर।

सुरक्षित आश्रय प्रमाणन के लिए मान्यता

HIPAA का सुरक्षित आश्रय विधि आवश्यक है कि कवर की गई संस्था "इस जानकारी के बारे में वास्तविक ज्ञान नहीं रखती है कि इसे अकेले या अन्य जानकारी के साथ मिलाकर किसी व्यक्ति की पहचान के लिए उपयोग किया जा सकता है।"

कस्टम एंटिटी-आधारित पहचान के लिए, मान्यता पूर्णता को प्रदर्शित करती है:

चरण 1: नमूना निष्कर्षण प्रत्येक सुविधा प्रकार से 100 डिस्चार्ज सारांश निकालें। रोगी जनसंख्या, विभागों और समय अवधि को मिलाएं।

चरण 2: स्वचालित प्रसंस्करण 400 दस्तावेज़ों को कस्टम एंटिटी पहचान के माध्यम से चलाएं।

चरण 3: मानव मान्यता नमूना 20 संसाधित दस्तावेज़ों की मैन्युअल समीक्षा करें (5% नमूना)। देखें:

  • कोई भी स्ट्रिंग जो MRNs की तरह दिखती है लेकिन पहचान नहीं की गई (झूठी नकारात्मक)
  • कोई भी गैर-MRN स्ट्रिंग जो गलत तरीके से चिह्नित की गई (झूठी सकारात्मक)

चरण 4: पैटर्न परिष्करण यदि झूठी नकारात्मक पाई जाती हैं: पैटर्न को परिष्कृत करें या संदर्भ मिलान जोड़ें। यदि झूठी सकारात्मक संख्या में हैं: शब्द सीमा प्रतिबंध या संदर्भ मान्यता जोड़ें।

चरण 5: दस्तावेज़ीकरण रिकॉर्ड करें: कस्टम एंटिटी परिभाषा, मान्यता नमूना आकार, मान्यता परिणाम, और मान्यता की तारीख। यह दस्तावेज़ सुरक्षित आश्रय प्रमाणन का समर्थन करता है।

MRNs से परे: पूर्ण HIPAA सुरक्षित आश्रय कवरेज

MRN पहचान के अंतर को संबोधित करने के बाद, सभी 18 सुरक्षित आश्रय श्रेणियों की पूर्णता की समीक्षा करें:

श्रेणीमानक पहचानकस्टम की आवश्यकता?
1. नाम✓ NER मॉडलनहीं
2. भौगोलिक डेटा✓ स्थान पहचानराज्य के लिए नहीं; सुविधा-विशिष्ट कोड के लिए हाँ
3. तिथियाँ✓ तिथि पहचाननहीं
4. फोन नंबर✓ फोन पहचाननहीं
5. फैक्स नंबर✓ फोन पहचाननहीं
6. ईमेल पते✓ ईमेल पहचाननहीं
7. SSNs✓ SSN पहचाननहीं
8. मेडिकल रिकॉर्ड नंबर✗ डिफ़ॉल्ट में नहींहाँ - संस्थान-विशिष्ट
9. स्वास्थ्य योजना लाभार्थी नंबरआंशिकअक्सर हाँ - वाहक-विशिष्ट
10. खाता नंबरआंशिकअक्सर हाँ - बिलिंग खाता प्रारूप
11. प्रमाण पत्र/लाइसेंस नंबरआंशिकअक्सर हाँ - DEA + राज्य-विशिष्ट
12. वाहन पहचानकर्ताआंशिकनैदानिक दस्तावेज़ों में शायद ही कभी
13. उपकरण पहचानकर्ताआंशिकहाँ यदि चिकित्सा उपकरण दस्तावेजित हैं
14. वेब यूआरएल✓ यूआरएल पहचाननहीं
15. आईपी पते✓ आईपी पहचाननहीं
16. बायोमेट्रिक पहचानकर्ता✗ पाठ संदर्भडिस्चार्ज सारांश में शायद ही कभी
17. पूर्ण-चेहरे की तस्वीरें✗ केवल छविपाठ प्रसंस्करण के लिए दायरे से बाहर
18. अन्य अद्वितीय पहचानकर्ता✗ डिफ़ॉल्ट में नहींहाँ - संस्थान-विशिष्ट

क्लिनिकल टेक्स्ट प्रसंस्करण के लिए, श्रेणियाँ 8, 9, 10, और 18 सबसे सामान्यतः कस्टम एंटिटी जोड़ने की आवश्यकता होती हैं।

क्लिनिकल दस्तावेज़ीकरण संदर्भ

डिस्चार्ज सारांश, क्लिनिकल नोट्स, और ऑपरेटिव रिपोर्ट मुख्य दस्तावेज़ हैं जिन्हें अनुसंधान साझा करने के लिए HIPAA पहचान रहित करने की आवश्यकता होती है। इन दस्तावेज़ों में शामिल हैं:

  • हेडर और फुटर में MRNs
  • बिलिंग अनुभागों में खाता नंबर
  • पूरे में तिथियाँ (प्रवेश, प्रक्रियाएँ, प्रयोगशालाएँ, दवाएँ)
  • चिकित्सक के नाम और DEA नंबर
  • संदर्भित चिकित्सक की जानकारी
  • बीमा सदस्य आईडी

संस्थान-विशिष्ट प्रारूपों (MRNs, खाता नंबर) के लिए कस्टम एंटिटी पहचान को सार्वभौमिक प्रारूपों (तिथियाँ, नाम, फोन नंबर) के लिए मानक पहचान के साथ मिलाकर वह पूर्ण कवरेज प्रदान करता है जो HIPAA सुरक्षित आश्रय की आवश्यकता है।

निष्कर्ष

कस्टम एंटिटी कॉन्फ़िगरेशन के बिना HIPAA पहचान रहित करना HIPAA सुरक्षित आश्रय पहचान रहित करना नहीं है। हर स्वास्थ्य देखभाल संस्थान का MRN प्रारूप अद्वितीय होता है। मानक PII उपकरण उन्हें चूक जाते हैं। अनुपालन टीमें इस अंतर को बंद करने के लिए इंजीनियरिंग कतारों के लिए इंतजार नहीं कर सकतीं।

एआई-सहायता प्राप्त पैटर्न निर्माण अनुपालन अंतर को 6-8 सप्ताह के इंजीनियरिंग समय से अनुपालन अधिकारी के काम के एक दोपहर में संकुचित करता है। प्रारूप का वर्णन करें, नमूनों के खिलाफ मान्यता करें, उत्पादन में लागू करें।

स्रोत:

क्या आप अपने डेटा की सुरक्षा के लिए तैयार हैं?

48 भाषाओं में 285+ संस्थाओं के प्रकारों के साथ PII अनामकरण शुरू करें।