Regex Doktora Gerek Olmadan HIPAA De-Identifikasyonu: AI Destekli MRN Deseni Oluşturma
Hastanenizin Tıbbi Kayıt Numarası formatı, herhangi bir standart PII aracında mevcut değildir. İşte bunu 5 dakikada, tek bir regex satırı yazmadan nasıl ekleyeceğiniz.
HIPAA de-identifikasyonu uygulayan sağlık IT ekipleri, diğer sektörlerde olmayan belirli bir zorlukla karşı karşıyadır: En çok tespit etmeleri gereken tanımlayıcı — Tıbbi Kayıt Numarası — kendi kurumları tarafından tanımlanır, herhangi bir ulusal standart tarafından değil.
Sonuç: Bir sağlık sistemi içindeki her HIPAA de-identifikasyonu uygulaması, özel yapılandırma gerektirir. Özel yapılandırma olmadan, MRN'ler "de-identifiye" veri setlerinden tespit edilmeden geçer.
Çoklu Tesis MRN Kaosu
Yıllar süren satın almalarla oluşturulan sağlık ağları, her biri on yıllar önce belirlenmiş kendi MRN formatına sahip eski EHR sistemleri içeren tesisler içerir:
- Memorial Hastanesi (2015'ten beri Epic): MRN:XXXXXXX (ön ekli 7 haneli sayısal)
- St. Mary's (eski Cerner sistemi): PT-YYYYY (hasta ön eki ile 5 haneli)
- Üniversite Hastanesi (Meditech 6.0): UHN-XXXXXXXXXX (10 karakter alfanümerik)
- Bağlı klinik (bağımsız EMR): Cd{5} (C'den sonra 5 rakam)
HIPAA Güvenli Liman, "tıbbi kayıt numaraları" (kategori 8) dahil olmak üzere tüm 18 tanımlayıcı kategorisinin kaldırılmasını gerektirir. Bu formatları bilmeyen bir de-identifikasyon aracı, bunları tamamen kaçırır. "De-identifiye" veri seti, dört tesis formatının tüm MRN'lerini içerir.
ServiceNow'un sağlık topluluğu, bu acı noktayı özellikle belgeler: PHI'yi HR çalışma notlarından tanımlamaya çalışan sağlık IT ekipleri, standart Presidio yapılandırmalarının SSN'leri ve telefon numaralarını tespit ettiğini ancak tesis spesifik MRN'leri tamamen kaçırdığını bulur.
Regex Engeli
Microsoft Presidio'da (birçok HIPAA aracının açık kaynak temeli) özel tanıyıcılar oluşturmak için:
- PatternRecognizer sınıfını anlamak
- Python sözdiziminde regex desenleri yazmak
- Tanıyıcı kaydı için YAML dosyalarını yapılandırmak
- Güven puanlarını ve bağlam kelimelerini anlamak
- Python betikleri ile test etmek
- Başarısız tanıyıcıları hata ayıklamak
Python geçmişi olmayan sağlık IT profesyonelleri için bu, önemli bir teknik engel oluşturur. MRN:XXXXXXX formatını tam olarak bilen bir uyum görevlisi, ya Python öğrenmeden ya da bir mühendislik bileti beklemeden bir Presidio tanıyıcısını yapılandıramaz.
Tipik sonuç: uyum açığı açık kalırken mühendislik bileti 6-8 haftalık bir kuyrukta bekler.
AI Destekli Desen Oluşturma
Alternatif: deseni sade bir dille tanımlayın, çalışan bir regex alın.
Süreç:
- Özel varlık oluşturucu açın
- Örnekler sağlayın: "Bunlar sistemimizden MRN numaralarına benziyor: MRN:1234567, MRN:9876543, MRN:0001234"
- AI deseni oluşturur: MRN:d{7}
- 10 örnek taburcu özetine karşı test edin
- Tüm MRN'ler tespit edildi mi? Kaydedin ve uygulayın.
Dört MRN formatına sahip çoklu tesis ağı için:
- Memorial Hastanesi: formatı tanımlayın → MRN:d{7}
- St. Mary's: formatı tanımlayın → PT-d{5}
- Üniversite Hastanesi: formatı tanımlayın → UHN-[A-Z0-9]{10}
- Bağlı klinik: formatı tanımlayın → Cd{5}
Dört özel varlık oluşturun, "Ağ MRN Tespiti" ön ayarına gruplayın, tüm belge işleme uygulayın. Toplam süre: bir öğleden sonra uyum görevlisi çalışması.
Güvenli Liman Sertifikası için Doğrulama
HIPAA'nın Güvenli Liman yöntemi, kapsanan varlığın "bilgilerin bir bireyi tanımlamak için yalnızca veya diğer bilgilerle bir arada kullanılabileceği konusunda gerçek bir bilgisi olmadığını" gerektirir.
Özel varlık tabanlı tespit için, doğrulama tamlığı gösterir:
Adım 1: Örnek çıkarımı Her tesis türünden 100 taburcu özeti alın. Hasta popülasyonlarını, departmanları ve zaman dilimlerini karıştırın.
Adım 2: Otomatik işleme Tüm 400 belgeyi özel varlık tespitinden geçirin.
Adım 3: İnsan doğrulama örneği İşlenmiş 20 belgeyi manuel olarak gözden geçirin (%5 örnek). Şunları arayın:
- MRN gibi görünen ancak tespit edilmeyen herhangi bir dize (yanlış negatif)
- Yanlış bir şekilde işaretlenmiş herhangi bir non-MRN dizesi (yanlış pozitif)
Adım 4: Desen iyileştirme Eğer yanlış negatifler bulunursa: deseni iyileştirin veya bağlam eşleşmesi ekleyin. Eğer yanlış pozitifler çoksa: kelime sınırı kısıtlamaları veya bağlam doğrulaması ekleyin.
Adım 5: Dokümantasyon Kaydedin: özel varlık tanımı, doğrulama örnek boyutu, doğrulama sonuçları ve doğrulama tarihi. Bu dokümantasyon, Güvenli Liman sertifikasını destekler.
MRN'lerin Ötesinde: Tam HIPAA Güvenli Liman Kapsamı
MRN tespit açığını ele aldıktan sonra, tamlık için tüm 18 Güvenli Liman kategorisini gözden geçirin:
| Kategori | Standart Tespit | Özel Gerekli mi? |
|---|---|---|
| 1. İsimler | ✓ NER modeli | Hayır |
| 2. Coğrafi veriler | ✓ Konum tespiti | Eyalet için hayır; tesis spesifik kodlar için evet |
| 3. Tarihler | ✓ Tarih tespiti | Hayır |
| 4. Telefon numaraları | ✓ Telefon tespiti | Hayır |
| 5. Faks numaraları | ✓ Telefon tespiti | Hayır |
| 6. E-posta adresleri | ✓ E-posta tespiti | Hayır |
| 7. SSN'ler | ✓ SSN tespiti | Hayır |
| 8. Tıbbi kayıt numaraları | ✗ Varsayılan değil | Evet — kuruma özgü |
| 9. Sağlık planı yararlanıcı numaraları | Kısmi | Genellikle evet — taşıyıcıya özgü |
| 10. Hesap numaraları | Kısmi | Genellikle evet — faturalama hesap formatı |
| 11. Sertifika/lisans numaraları | Kısmi | Genellikle evet — DEA + eyalet spesifik |
| 12. Araç tanımlayıcıları | Kısmi | Klinik belgelerde nadir |
| 13. Cihaz tanımlayıcıları | Kısmi | Tıbbi cihazlar belgelenmişse evet |
| 14. Web URL'leri | ✓ URL tespiti | Hayır |
| 15. IP adresleri | ✓ IP tespiti | Hayır |
| 16. Biyometrik tanımlayıcılar | ✗ Metin bağlamı | Taburcu özetlerinde nadir |
| 17. Tam yüz fotoğrafları | ✗ Sadece görüntü | Metin işleme kapsamının dışında |
| 18. Diğer benzersiz tanımlayıcılar | ✗ Varsayılan değil | Evet — kuruma özgü |
Klinik metin işleme için, kategoriler 8, 9, 10 ve 18 en yaygın olarak özel varlık eklenmesini gerektirir.
Klinik Dokümantasyon Bağlamı
Taburcu özetleri, klinik notlar ve operasyon raporları, araştırma paylaşımı için HIPAA de-identifikasyonu gerektiren birincil belgelerdir. Bu belgeler şunları içerir:
- Başlıklar ve alt bilgilerde MRN'ler
- Faturalama bölümlerinde hesap numaraları
- Her yerde tarihler (kabul, prosedürler, laboratuvarlar, ilaçlar)
- Doktor isimleri ve DEA numaraları
- Sevk eden doktor bilgileri
- Sigorta üye kimlikleri
Kurum spesifik formatlar (MRN'ler, hesap numaraları) için özel varlık tespiti ile evrensel formatlar (tarihler, isimler, telefon numaraları) için standart tespit, HIPAA Güvenli Limanının gerektirdiği tam kapsamı sağlar.
Sonuç
Özel varlık yapılandırması olmadan HIPAA de-identifikasyonu, HIPAA Güvenli Liman de-identifikasyonu değildir. Her sağlık kurumunun MRN formatı benzersizdir. Standart PII araçları bunları kaçırır. Uyum ekipleri, bu açığı kapatmak için mühendislik kuyruklarının kapanmasını bekleyemez.
AI destekli desen oluşturma, uyum açığını mühendislik süresinin 6-8 haftasından bir öğleden sonra uyum görevlisi çalışmasına indirger. Formatı tanımlayın, örneklerle doğrulayın, üretime dağıtın.
Kaynaklar: