Bloga DönSağlık Hizmetleri

Regex Doktora Gerek Olmadan HIPAA De-Identifikasyonu...

Her hastanenin MRN formatı farklıdır. Memorial MRN:XXXXXXX kullanırken, St. Mary's PT-YYYYY, Üniversite Hastanesi UHN-XXXXXXXXXX kullanır.

April 20, 20266 dk okuma
HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

Regex Doktora Gerek Olmadan HIPAA De-Identifikasyonu: AI Destekli MRN Deseni Oluşturma

Hastanenizin Tıbbi Kayıt Numarası formatı, herhangi bir standart PII aracında mevcut değildir. İşte bunu 5 dakikada, tek bir regex satırı yazmadan nasıl ekleyeceğiniz.

HIPAA de-identifikasyonu uygulayan sağlık IT ekipleri, diğer sektörlerde olmayan belirli bir zorlukla karşı karşıyadır: En çok tespit etmeleri gereken tanımlayıcı — Tıbbi Kayıt Numarası — kendi kurumları tarafından tanımlanır, herhangi bir ulusal standart tarafından değil.

Sonuç: Bir sağlık sistemi içindeki her HIPAA de-identifikasyonu uygulaması, özel yapılandırma gerektirir. Özel yapılandırma olmadan, MRN'ler "de-identifiye" veri setlerinden tespit edilmeden geçer.

Çoklu Tesis MRN Kaosu

Yıllar süren satın almalarla oluşturulan sağlık ağları, her biri on yıllar önce belirlenmiş kendi MRN formatına sahip eski EHR sistemleri içeren tesisler içerir:

  • Memorial Hastanesi (2015'ten beri Epic): MRN:XXXXXXX (ön ekli 7 haneli sayısal)
  • St. Mary's (eski Cerner sistemi): PT-YYYYY (hasta ön eki ile 5 haneli)
  • Üniversite Hastanesi (Meditech 6.0): UHN-XXXXXXXXXX (10 karakter alfanümerik)
  • Bağlı klinik (bağımsız EMR): Cd{5} (C'den sonra 5 rakam)

HIPAA Güvenli Liman, "tıbbi kayıt numaraları" (kategori 8) dahil olmak üzere tüm 18 tanımlayıcı kategorisinin kaldırılmasını gerektirir. Bu formatları bilmeyen bir de-identifikasyon aracı, bunları tamamen kaçırır. "De-identifiye" veri seti, dört tesis formatının tüm MRN'lerini içerir.

ServiceNow'un sağlık topluluğu, bu acı noktayı özellikle belgeler: PHI'yi HR çalışma notlarından tanımlamaya çalışan sağlık IT ekipleri, standart Presidio yapılandırmalarının SSN'leri ve telefon numaralarını tespit ettiğini ancak tesis spesifik MRN'leri tamamen kaçırdığını bulur.

Regex Engeli

Microsoft Presidio'da (birçok HIPAA aracının açık kaynak temeli) özel tanıyıcılar oluşturmak için:

  • PatternRecognizer sınıfını anlamak
  • Python sözdiziminde regex desenleri yazmak
  • Tanıyıcı kaydı için YAML dosyalarını yapılandırmak
  • Güven puanlarını ve bağlam kelimelerini anlamak
  • Python betikleri ile test etmek
  • Başarısız tanıyıcıları hata ayıklamak

Python geçmişi olmayan sağlık IT profesyonelleri için bu, önemli bir teknik engel oluşturur. MRN:XXXXXXX formatını tam olarak bilen bir uyum görevlisi, ya Python öğrenmeden ya da bir mühendislik bileti beklemeden bir Presidio tanıyıcısını yapılandıramaz.

Tipik sonuç: uyum açığı açık kalırken mühendislik bileti 6-8 haftalık bir kuyrukta bekler.

AI Destekli Desen Oluşturma

Alternatif: deseni sade bir dille tanımlayın, çalışan bir regex alın.

Süreç:

  1. Özel varlık oluşturucu açın
  2. Örnekler sağlayın: "Bunlar sistemimizden MRN numaralarına benziyor: MRN:1234567, MRN:9876543, MRN:0001234"
  3. AI deseni oluşturur: MRN:d{7}
  4. 10 örnek taburcu özetine karşı test edin
  5. Tüm MRN'ler tespit edildi mi? Kaydedin ve uygulayın.

Dört MRN formatına sahip çoklu tesis ağı için:

  • Memorial Hastanesi: formatı tanımlayın → MRN:d{7}
  • St. Mary's: formatı tanımlayın → PT-d{5}
  • Üniversite Hastanesi: formatı tanımlayın → UHN-[A-Z0-9]{10}
  • Bağlı klinik: formatı tanımlayın → Cd{5}

Dört özel varlık oluşturun, "Ağ MRN Tespiti" ön ayarına gruplayın, tüm belge işleme uygulayın. Toplam süre: bir öğleden sonra uyum görevlisi çalışması.

Güvenli Liman Sertifikası için Doğrulama

HIPAA'nın Güvenli Liman yöntemi, kapsanan varlığın "bilgilerin bir bireyi tanımlamak için yalnızca veya diğer bilgilerle bir arada kullanılabileceği konusunda gerçek bir bilgisi olmadığını" gerektirir.

Özel varlık tabanlı tespit için, doğrulama tamlığı gösterir:

Adım 1: Örnek çıkarımı Her tesis türünden 100 taburcu özeti alın. Hasta popülasyonlarını, departmanları ve zaman dilimlerini karıştırın.

Adım 2: Otomatik işleme Tüm 400 belgeyi özel varlık tespitinden geçirin.

Adım 3: İnsan doğrulama örneği İşlenmiş 20 belgeyi manuel olarak gözden geçirin (%5 örnek). Şunları arayın:

  • MRN gibi görünen ancak tespit edilmeyen herhangi bir dize (yanlış negatif)
  • Yanlış bir şekilde işaretlenmiş herhangi bir non-MRN dizesi (yanlış pozitif)

Adım 4: Desen iyileştirme Eğer yanlış negatifler bulunursa: deseni iyileştirin veya bağlam eşleşmesi ekleyin. Eğer yanlış pozitifler çoksa: kelime sınırı kısıtlamaları veya bağlam doğrulaması ekleyin.

Adım 5: Dokümantasyon Kaydedin: özel varlık tanımı, doğrulama örnek boyutu, doğrulama sonuçları ve doğrulama tarihi. Bu dokümantasyon, Güvenli Liman sertifikasını destekler.

MRN'lerin Ötesinde: Tam HIPAA Güvenli Liman Kapsamı

MRN tespit açığını ele aldıktan sonra, tamlık için tüm 18 Güvenli Liman kategorisini gözden geçirin:

KategoriStandart TespitÖzel Gerekli mi?
1. İsimler✓ NER modeliHayır
2. Coğrafi veriler✓ Konum tespitiEyalet için hayır; tesis spesifik kodlar için evet
3. Tarihler✓ Tarih tespitiHayır
4. Telefon numaraları✓ Telefon tespitiHayır
5. Faks numaraları✓ Telefon tespitiHayır
6. E-posta adresleri✓ E-posta tespitiHayır
7. SSN'ler✓ SSN tespitiHayır
8. Tıbbi kayıt numaraları✗ Varsayılan değilEvet — kuruma özgü
9. Sağlık planı yararlanıcı numaralarıKısmiGenellikle evet — taşıyıcıya özgü
10. Hesap numaralarıKısmiGenellikle evet — faturalama hesap formatı
11. Sertifika/lisans numaralarıKısmiGenellikle evet — DEA + eyalet spesifik
12. Araç tanımlayıcılarıKısmiKlinik belgelerde nadir
13. Cihaz tanımlayıcılarıKısmiTıbbi cihazlar belgelenmişse evet
14. Web URL'leri✓ URL tespitiHayır
15. IP adresleri✓ IP tespitiHayır
16. Biyometrik tanımlayıcılar✗ Metin bağlamıTaburcu özetlerinde nadir
17. Tam yüz fotoğrafları✗ Sadece görüntüMetin işleme kapsamının dışında
18. Diğer benzersiz tanımlayıcılar✗ Varsayılan değilEvet — kuruma özgü

Klinik metin işleme için, kategoriler 8, 9, 10 ve 18 en yaygın olarak özel varlık eklenmesini gerektirir.

Klinik Dokümantasyon Bağlamı

Taburcu özetleri, klinik notlar ve operasyon raporları, araştırma paylaşımı için HIPAA de-identifikasyonu gerektiren birincil belgelerdir. Bu belgeler şunları içerir:

  • Başlıklar ve alt bilgilerde MRN'ler
  • Faturalama bölümlerinde hesap numaraları
  • Her yerde tarihler (kabul, prosedürler, laboratuvarlar, ilaçlar)
  • Doktor isimleri ve DEA numaraları
  • Sevk eden doktor bilgileri
  • Sigorta üye kimlikleri

Kurum spesifik formatlar (MRN'ler, hesap numaraları) için özel varlık tespiti ile evrensel formatlar (tarihler, isimler, telefon numaraları) için standart tespit, HIPAA Güvenli Limanının gerektirdiği tam kapsamı sağlar.

Sonuç

Özel varlık yapılandırması olmadan HIPAA de-identifikasyonu, HIPAA Güvenli Liman de-identifikasyonu değildir. Her sağlık kurumunun MRN formatı benzersizdir. Standart PII araçları bunları kaçırır. Uyum ekipleri, bu açığı kapatmak için mühendislik kuyruklarının kapanmasını bekleyemez.

AI destekli desen oluşturma, uyum açığını mühendislik süresinin 6-8 haftasından bir öğleden sonra uyum görevlisi çalışmasına indirger. Formatı tanımlayın, örneklerle doğrulayın, üretime dağıtın.

Kaynaklar:

Verilerinizi korumaya hazır mısınız?

48 dilde 285+ varlık türü ile PII anonimleştirmeye başlayın.