HIPAA MRN tuvastamine ilma regex-doktorita
Teie haigla MRN-formaat pole üheski standardses isikuandmete tuvastamise tööriistas. Siin on, kuidas seda viie minutiga lisada. Koodi pole vaja.
Tervishoiu IT-meeskonnad seisavad silmitsi HIPAA probleemiga, mis teistel sektorittel puudub. ID, mida nad kõige rohkem peavad leidma - meditsiinilise registri number (MRN) - on seatud nende oma haigla poolt. Ühtset riiklikku standardit pole olemas.
Iga HIPAA de-identifitseerimise projekt vajab kohandatud seadistust. Ilma selleta libisevad MRN-id "de-identifitseeritud" failidest läbi tuvastamata.
Mitme asutuse MRN probleem
Ühinemiste kaudu rajatud haiglavõrgud on pärand EHR-süsteemid. Igal süsteemil on oma MRN-formaat:
- Memorial Hospital (Epic): MRN:XXXXXXX - 7-kohaline number eesliitega
- St. Mary's (Cerner): PT-YYYYY - 5-kohaline koos patsiendi eesliitega
- University Hospital (Meditech): UHN-XXXXXXXXXX - 10-merkiline segu
- Kliinik (eraldiseisev EMR): C\d{5} - täht C pluss 5 numbrit
HIPAA Safe Harbor nõuab kõigi 18 ID tüübi eemaldamist. Kategooria 8 on meditsiinilise registri numbrid. Tööriist, mis ei tea teie formaati, jätab need vahele. Fail näib puhas. See ei ole seda.
ServiceNow tervishoiu kogukond on märkinud selle täpse probleemi. Tavalised tööriistad tuvastavad isikukoode ja telefoninumbreid. Asutuse MRN-e jätavad nad alati vahele.
Regex-i takistus
Kohandatud reeglite lisamine Microsoft Presidiosse - mis on paljude HIPAA tööriistade avatud lähtekoodiga alus - nõuab tegelikke oskusi:
- Peate tundma klassi PatternRecognizer
- Peate kirjutama regexis Pythoni süntaksis
- Peate seadistama YAML konfiguratsioonifaile
- Peate häalestama usaldusskoorid
- Peate testima ja siluma Pythoni skripte
Vastavusjuht, kes teab MRN-formaati, ei suuda seda üksi teha. Parandus jõuab tehnikapiletina järjekorda. See istub seal 6-8 nadalat. Lünk jääb lahtiseks.
Tehisintellekti abistatud mustri genereerimine
On kiirem viis. Kirjeldage mustrit lihtsate sõnadega. Saate toimiva regex-i tagasi.
Sammud:
- Avage kohandatud olemi ehitaja
- Andke naited: "Meie MRN-id naekvad välja nii: MRN:1234567, MRN:9876543, MRN:0001234"
- Tehisintellekt ehitab reegli: MRN:\d{7}
- Testib 10 näidisandmestikul
- Kõik MRN-id leitud? Salvestage ja juurutage.
Vorgu jaoks, millel on neli MRN-formaati:
- Memorial Hospital -> MRN:\d{7}
- St. Mary's -> PT-\d{5}
- University Hospital -> UHN-[A-Z0-9]{10}
- Kliinik -> C\d{5}
Looge neli kohandatud olemit. Rühmitage need eelsättesse. Käivitage kõigi failide puhul. Aeg: uks parastlounane.
Vt kohandatud MRN tuvastamine HIPAA konveierites ilma koodita terviklike juhiste saamiseks.
Valideerimine Safe Harbori jaoks
HIPAA Safe Harbor ütleb, et kaetud üksusel ei tohi olla "tegelikke teadmisi", et andmed võiksid kedagi tuvastada. (45 CFR §164.514(b))
Valideerimine näitab, et teie kohandatud reeglid katavad kõik 18 ID tüüpi.
1. samm: võtke näidiseid. Hankige 100 andmestikku igast asutusest. Segage ajaperioode ja osakondi.
2. samm: käivitage tuvastamine. Toodelge kohandatud reeglitega kõik 400 dokumenti.
3. samm: inimeste kontroll. Vaadake 20 dokumenti käsitsi üle (5% näidis). Otsige vahele jäänud MRN-e ja valepositiivseid.
4. samm: täiustage reegleid. Jäid MRN-id vahele? Laiendage mustrit. Liiga palju valepositiivseid? Lisage sõnapiirid.
5. samm: kirjutage see üles. Logige reegel, näidise suurus, tulemused ja kuupäev. See logi on teie Safe Harbori andmestik.
Vt selgitatav redaktsioon ja HIPAA auditi rajad lisateabe saamiseks selle kohta, mida dokumenteerida.
Täielik Safe Harbori katvus
Pärast MRN tuvastamise parandamist kontrollige kõiki 18 kategooriat.
| Kategooria | Tavalised tööriistad | Kohandatud vaja? |
|---|---|---|
| 1. Nimed | NER mudel | Ei |
| 2. Geograafilised andmed | Asukoha tuvastamine | Ei osariigi jaoks; Jah saidi koodide jaoks |
| 3. Kuupäevad | Kuupäeva tuvastamine | Ei |
| 4. Telefoninumbrid | Telefoni tuvastamine | Ei |
| 5. Faksinumbrid | Telefoni tuvastamine | Ei |
| 6. E-posti aadressid | E-posti tuvastamine | Ei |
| 7. Isikukoodid | Isikukoodi tuvastamine | Ei |
| 8. Meditsiinilise registri numbrid | Pole sisseehitatud | Jah - asutusepohine |
| 9. Tervisekindlustuse liikmete numbrid | Osaline | Sageli jah - maksja-spetsiifiline |
| 10. Kontonumbrid | Osaline | Sageli jah - arveldusformaat |
| 11. Litsentsid | Osaline | Sageli jah - osariigipohine |
| 12. Soidukite ID-d | Osaline | Harv kliinilistes dokumentides |
| 13. Seadmete ID-d | Osaline | Jah, kui seadmed on andmestikes |
| 14. Veebi-URL-id | URL tuvastamine | Ei |
| 15. IP-aadressid | IP tuvastamine | Ei |
| 16. Biomeetrilised ID-d | Tekstikontekst | Harv väljakirjutamise märkmetes |
| 17. Fotod | Ainult pilt | Väljaspool teksti ulatust |
| 18. Muud unikaalsed ID-d | Pole sisseehitatud | Jah - asutusepohine |
Kliinilise teksti puhul vajavad kategooriad 8, 9, 10 ja 18 kõige sagedamini kohandatud seadistust.
Kliiniliste dokumentide kontekst
Väljakirjutamise märkmed, kliinilised märkmed ja operatsiooniaruanded on peamised failid, mida teadusuuringute jaoks jagatakse. Need sisaldavad:
- MRN-e päistes ja jaluses
- Kontonumbreid arvelduslõikudes
- Kuupäevi kõigi sündmuste jaoks - vastuvõtmine, protseduur, labor, ravim
- Arsti nimesid ja DEA numbreid
- Saatva arsti teavet
- Kindlustuse liikmete ID-sid
Asutusepohiste formaatide kohandatud reeglid töötavad koos sisseehitatud reeglitega standardsete formaatide jaoks. See kombinatsioon annab teile täieliku Safe Harbori katvuse.
Kokkuvõte
HIPAA de-identifitseerimine ilma kohandatud reegliteta ei ole Safe Harbor de-identifitseerimine. Iga haigla MRN-formaat on ainulaadne. Tavalised tööriistad jätavad need vahele. Vastavuse lünk on reaalne ja see jääb lahtiseks, kuni sulgete selle.
Tehisintellekti mustri genereerimine lühendab parandust 6-8 nadalalt insenerinduse aega üheks parastlounaks vastavustoo. Kirjeldage formaati. Testige seda reaalsete andmestike vastu. Juurutage see. Valmis.