Detekcia HIPAA MRN bez pokrocilej znalosti regexu
Format MRN vasej nemocnice nie je v ziadnom standardnom nastroji na PII. Tu je postup, ako ho pridat za pat minut. Bez kodovania.
IT timy v zdravotnictve celia problemu HIPAA, ktory ine sektory nemaju. ID, ktore potrebuju najst najcastejsie - cislo zdravotneho zaznamu (MRN) - si urcuje sama nemocnica. Neexistuje ziadny narodny standard.
Kazdy projekt HIPAA de-identifikacie vyzaduje vlastne nastavenie. Bez neho preniknaju MRN cez "de-identifikovane" subory nezistene.
Problem s MRN v sietach zdravotnickych zariadeni
Nemocnicne siete, ktore vznikli fuziami, maju starsie systemy EHR. Kazdy system ma vlastny format MRN:
- Memorial Hospital (Epic): MRN:XXXXXXX - 7-miestne cislo s predponou
- St. Mary's (Cerner): PT-YYYYY - 5-miestne s predponou pacienta
- University Hospital (Meditech): UHN-XXXXXXXXXX - 10-znakova kombinacia
- Klinika (samostatny EMR): C\d{5} - pismeno C plus 5 cislic
HIPAA Safe Harbor vyzaduje odstranenie vsetkych 18 typov ID. Kategoria 8 su cisla zdravotnickych zaznamov. Nastroj, ktory nespozanie vase format, ich prehliadne. Subor vyzera cisto. Nie je.
Komunita ServiceNow pre zdravotnictvo poukaze na tento presny problem. Standardne nastroje zachytia cisla socialneho poistenia a telefonne cisla. MRN zariadenia im vsak vzdycky uniknuc.
Bariéra regexu
Pridanie vlastnych pravidiel do Microsoft Presidio - open-source zakladu pre mnohé nastroje HIPAA - vyzaduje realne znalosti:
- Musíte poznaz triedu PatternRecognizer
- Musíte pisat regex v syntaxi Python
- Musíte nastavovat subory YAML config
- Musíte ladit skore dovernosi
- Musíte testovat a ladit skripty Python
Zodpovedny za suladenosta, ktory pozna format MRN, to sam nezvladne. Oprava skonci ako technicka poziadavka. Caka sa 6 az 8 tyzdnov. Medzera zostava otvorena.
Generovanie vzoru pomocou AI
Existuje rychlejsi sposob. Popiste vzor beznym jazykom. Ziskajte funkcionalny regex.
Kroky:
- Otvorte tvorcu vlastnych entit
- Zadajte priklady: "Nase MRN vypadata takto: MRN:1234567, MRN:9876543, MRN:0001234"
- AI vytvori pravidlo: MRN:\d{7}
- Testujte na 10 vzorkowych zaznamoch
- Vsetky MRN najdene? Ulozit a nasadit.
Pre siet so styrmi formatmi MRN:
- Memorial Hospital -> MRN:\d{7}
- St. Mary's -> PT-\d{5}
- University Hospital -> UHN-[A-Z0-9]{10}
- Klinika -> C\d{5}
Vytvorte styri vlastne entity. Zoskupte ich do predvolby. Spustite na vsetkych suboroch. Cas: jedno popoludnie.
Pozrite si vlastnu detekciu MRN v pipelinoch HIPAA bez kodovanie pre uplny navod.
Overovanie pre Safe Harbor
HIPAA Safe Harbor uvadza, ze kryta entita nesmie mat "skutocne znalosti", ze by udaje mohli niekoho identifikovat. (45 CFR §164.514(b))
Overovanie ukazuje, ze vase vlastne pravidla pokryvaju vsetkych 18 typov ID.
Krok 1: Ziskajte vzorky. Ziskajte 100 zaznamov z kazdeho pracoviska. Zmieste casove obdobia a oddelenia.
Krok 2: Spustite detekciu. Spracujte vsetkych 400 dokumentov s vasimi vlastnymi pravidlami.
Krok 3: Ludska kontrola. Zkontrolujte 20 dokumentov rucne (5% vzorka). Hladajte prehliadnute MRN a falsosne zhody.
Krok 4: Zdokonalte pravidla. Prehliadnute MRN? Rozsirte vzor. Prilis vela falsosnych zhod? Pridajte hranice slov.
Krok 5: Zaznamenajte to. Zaznamenajte pravidlo, velkost vzorky, vysledky a datum. Tento zaznam je vas rekord Safe Harbor.
Pozrite si vysvetlitelnu redakciu a auditne zaznamy HIPAA pre viac informacii o tom, co dokumentovat.
Uplne pokrytie Safe Harbor
Po oprave detekcie MRN skontrolujte vsetkych 18 kategorii.
| Kategoria | Standardne nastroje | Potrebne vlastne nastavenie? |
|---|---|---|
| 1. Mena | Model NER | Nie |
| 2. Geograficke udaje | Detekcia polohy | Nie pre stat; Ano pre kody pracovisk |
| 3. Datumy | Detekcia datumov | Nie |
| 4. Telefonne cisla | Detekcia telefonu | Nie |
| 5. Faxove cisla | Detekcia telefonu | Nie |
| 6. E-mailove adresy | Detekcia e-mailu | Nie |
| 7. Cisla soc. poistenia | Detekcia SSN | Nie |
| 8. Cisla zdravotnickych zaznamov | Nie je vstavane | Ano - specificke pre pracovisko |
| 9. Cisla clenov zdravotneho planu | Ciastocne | Casto ano - specificke pre platcu |
| 10. Cisla uctov | Ciastocne | Casto ano - format faktur |
| 11. Cisla licencii | Ciastocne | Casto ano - specificke pre stat |
| 12. ID vozidiel | Ciastocne | Zriedkave v klinickych dokumentoch |
| 13. ID zariadeni | Ciastocne | Ano ak su zariadenia v zaznamoch |
| 14. Webove URL | Detekcia URL | Nie |
| 15. IP adresy | Detekcia IP | Nie |
| 16. Biometricke ID | Textovy kontext | Zriedkave v prepustacich poznámkach |
| 17. Fotografie | Iba obrazky | Mimo rozsahu pre text |
| 18. Ine jedinecne ID | Nie je vstavane | Ano - specificke pre pracovisko |
Pre klinicky text kategorie 8, 9, 10 a 18 najcastejsie vyzaduju vlastne nastavenie.
Kontext klinickych dokumentov
Prepustacne poznamky, klinicke poznamky a operacne spravy su hlavne subory zdielane pre vyskum. Obsahuju:
- MRN v hlavickach a paticach
- Cisla uctov vo fakturacnych sekciach
- Datumy vsetkych udalosti - prijatie, vykon, laboratorium, liek
- Mena lekarov a cisla DEA
- Informacie o odosielajucom lekarovi
- Identifikatory poistenych
Vlastne pravidla pre formaty specificke pre pracovisko v kombinacii so vstavanymi pravidlami pre standardne formaty vam poskytnu uplne pokrytie Safe Harbor.
Zaver
HIPAA de-identifikacia bez vlastnych pravidiel nie je de-identifikacia podla Safe Harbor. Format MRN kazdeho zaradenia je jedinecny. Standardne nastroje ich prehliadnu. Medzera v sulade je realna a zostava otvorena, kym ju neuzavrete.
Generovanie vzoru pomocou AI skracuje opravu z 6 az 8 tyzdnov inzinierskiej prace na jedno popoludnie prace v oblasti suladenosta. Popizte format. Otestujte ho na realnych zaznamoch. Nasadte ho. Hotovo.