Deteksi MRN HIPAA Tanpa Keahlian Regex
Format MRN rumah sakit Anda tidak ada dalam alat PII standar mana pun. Berikut cara menambahkannya dalam lima menit. Tidak perlu kode.
Tim IT layanan kesehatan menghadapi masalah HIPAA yang tidak dimiliki sektor lain. ID yang paling perlu mereka temukan — Nomor Rekam Medis — ditetapkan oleh rumah sakit mereka sendiri. Tidak ada standar nasional yang ada.
Setiap proyek de-identifikasi HIPAA memerlukan pengaturan khusus. Tanpanya, MRN lolos dari berkas "teridentifikasi" tanpa terdeteksi.
Masalah MRN Multi-Fasilitas
Jaringan rumah sakit yang dibangun melalui merger memiliki sistem EHR warisan. Setiap sistem memiliki format MRN sendiri:
- Memorial Hospital (Epic): MRN:XXXXXXX — angka 7 digit dengan prefiks
- St. Mary's (Cerner): PT-YYYYY — 5 digit dengan prefiks pasien
- University Hospital (Meditech): UHN-XXXXXXXXXX — campuran 10 karakter
- Klinik (EMR mandiri): C\d{5} — huruf C ditambah 5 digit
HIPAA Safe Harbor mewajibkan penghapusan semua 18 jenis ID. Kategori 8 adalah nomor rekam medis. Alat yang tidak mengetahui format Anda akan melewatkannya. Berkas terlihat bersih. Padahal tidak.
Komunitas ServiceNow layanan kesehatan telah mencatat masalah yang persis sama ini. Alat standar menangkap SSN dan nomor telepon. Mereka melewatkan MRN fasilitas setiap saat.
Hambatan Regex
Menambahkan aturan khusus ke Microsoft Presidio — basis open-source untuk banyak alat HIPAA — memerlukan keahlian nyata:
- Anda perlu mengetahui kelas PatternRecognizer
- Anda harus menulis regex dalam sintaks Python
- Anda harus menyiapkan file konfigurasi YAML
- Anda harus menyetel skor kepercayaan
- Anda harus menguji dan men-debug skrip Python
Petugas kepatuhan yang mengetahui format MRN tidak dapat melakukan ini sendiri. Perbaikan akhirnya menjadi tiket rekayasa. Tiket itu mengantri 6–8 minggu. Celah tetap terbuka.
Pembuatan Pola Berbantuan AI
Ada cara yang lebih cepat. Deskripsikan pola dalam kata-kata sederhana. Dapatkan regex yang berfungsi.
Langkah-langkah:
- Buka pembuat entitas khusus
- Berikan contoh: "MRN kami terlihat seperti ini: MRN:1234567, MRN:9876543, MRN:0001234"
- AI membangun aturan: MRN:\d{7}
- Uji pada 10 catatan sampel
- Semua MRN ditemukan? Simpan dan terapkan.
Untuk jaringan dengan empat format MRN:
- Memorial Hospital → MRN:\d{7}
- St. Mary's → PT-\d{5}
- University Hospital → UHN-[A-Z0-9]{10}
- Klinik → C\d{5}
Buat empat entitas khusus. Kelompokkan ke dalam preset. Jalankan pada semua berkas. Waktu: satu siang.
Lihat deteksi MRN khusus dalam pipeline HIPAA tanpa kode untuk panduan lengkap.
Validasi untuk Safe Harbor
HIPAA Safe Harbor menyatakan bahwa entitas yang dicakup tidak boleh memiliki "pengetahuan aktual" bahwa data dapat mengidentifikasi seseorang. (45 CFR §164.514(b))
Validasi menunjukkan bahwa aturan khusus Anda mencakup semua 18 jenis ID.
Langkah 1: Ambil sampel. Dapatkan 100 catatan dari setiap situs. Campurkan periode waktu dan departemen.
Langkah 2: Jalankan deteksi. Proses semua 400 dokumen dengan aturan khusus Anda.
Langkah 3: Pemeriksaan manusia. Tinjau 20 dokumen secara manual (sampel 5%). Cari MRN yang terlewat dan deteksi yang salah.
Langkah 4: Sempurnakan aturan. Ada MRN yang terlewat? Perluas polanya. Terlalu banyak deteksi salah? Tambahkan batas kata.
Langkah 5: Catat. Catat aturan, ukuran sampel, hasil, dan tanggal. Log ini adalah catatan Safe Harbor Anda.
Lihat redaksi yang dapat dijelaskan dan jejak audit HIPAA untuk lebih lanjut tentang apa yang harus didokumentasikan.
Cakupan Safe Harbor Lengkap
Setelah memperbaiki deteksi MRN, periksa semua 18 kategori.
| Kategori | Alat Standar | Perlu Kustom? |
|---|---|---|
| 1. Nama | Model NER | Tidak |
| 2. Data geografis | Deteksi lokasi | Tidak untuk negara bagian; Ya untuk kode situs |
| 3. Tanggal | Deteksi tanggal | Tidak |
| 4. Nomor telepon | Deteksi telepon | Tidak |
| 5. Nomor faks | Deteksi telepon | Tidak |
| 6. Alamat email | Deteksi email | Tidak |
| 7. SSN | Deteksi SSN | Tidak |
| 8. Nomor rekam medis | Tidak bawaan | Ya — spesifik situs |
| 9. Nomor anggota rencana kesehatan | Sebagian | Sering ya — spesifik pembayar |
| 10. Nomor akun | Sebagian | Sering ya — format penagihan |
| 11. Nomor lisensi | Sebagian | Sering ya — spesifik negara bagian |
| 12. ID kendaraan | Sebagian | Jarang dalam dokumen klinis |
| 13. ID perangkat | Sebagian | Ya jika perangkat ada dalam catatan |
| 14. URL web | Deteksi URL | Tidak |
| 15. Alamat IP | Deteksi IP | Tidak |
| 16. ID biometrik | Konteks teks | Jarang dalam catatan keluar |
| 17. Foto | Hanya gambar | Di luar cakupan untuk teks |
| 18. ID unik lainnya | Tidak bawaan | Ya — spesifik situs |
Untuk teks klinis, kategori 8, 9, 10, dan 18 paling sering memerlukan pengaturan khusus.
Konteks Dokumen Klinis
Catatan keluar, catatan klinis, dan laporan operasi adalah berkas utama yang dibagikan untuk penelitian. Berkas-berkas ini berisi:
- MRN di header dan footer
- Nomor akun di bagian penagihan
- Tanggal untuk semua kejadian — masuk, prosedur, lab, obat
- Nama dokter dan nomor DEA
- Informasi dokter perujuk
- ID anggota asuransi
Aturan khusus untuk format spesifik situs dipasangkan dengan aturan bawaan untuk format standar. Pasangan itu memberikan cakupan Safe Harbor penuh.
Kesimpulan
De-identifikasi HIPAA tanpa aturan khusus bukan de-identifikasi Safe Harbor. Format MRN setiap rumah sakit unik. Alat standar melewatkannya. Celah kepatuhan nyata dan tetap terbuka sampai Anda menutupnya.
Pembuatan pola AI memangkas perbaikan dari 6–8 minggu rekayasa menjadi satu siang kerja kepatuhan. Deskripsikan formatnya. Uji pada catatan nyata. Terapkan. Selesai.