HIPAA MRN-deteksjon uten regex-doktorgrad
Sykehusets MRN-format finnes ikke i noe standard PII-verktoy. Slik legger du det til pa fem minutter. Ingen kode nodvendig.
IT-team i helsevesenet stater overfor et HIPAA-problem som andre sektorer ikke har. Den ID-en de mest trenger a finne - medisinsk journalnummer - er satt av sitt eget sykehus. Det finnes ingen nasjonal standard.
Hvert HIPAA-anonymiseringsprosjekt trenger tilpasset oppsett. Uten det slipper MRN-er gjennom "anonymiserte" filer uoppdaget.
MRN-problemet med flere fasiliteter
Sykehusnett bygd gjennom fusjoner har eldre EHR-systemer. Hvert system har sitt eget MRN-format:
- Memorial Hospital (Epic): MRN:XXXXXXX - 7-sifret tall med prefiks
- St. Mary's (Cerner): PT-YYYYY - 5-sifret med pasientprefiks
- University Hospital (Meditech): UHN-XXXXXXXXXX - 10-tegns blanding
- Klinikk (frittstenende EMR): C\d{5} - bokstaven C pluss 5 sifre
HIPAA Safe Harbor krever fjerning av alle 18 ID-typer. Kategori 8 er medisinske journalnumre. Et verktoy som ikke kjenner formatet ditt vil mangle dem. Filen ser ren ut. Den er det ikke.
ServiceNow-helsefellesskapet har pekt pa dette noyaktige problemet. Standard verktoy fanger opp personnumre og telefonnumre. De mangler fasilitets-MRN-er hver gang.
Regex-barrieren
A legge til tilpassede regler i Microsoft Presidio - den apne kilden til mange HIPAA-verktoy - krever ekte ferdigheter:
- Du ma kjenne PatternRecognizer-klassen
- Du ma skrive regex i Python-syntaks
- Du ma sette opp YAML-konfigurasjonsfiler
- Du ma stille inn konfidenspoeng
- Du ma teste og feilsoke Python-skript
En samsvarsansvarlig som kjenner MRN-formatet kan ikke gjore dette alene. Losningen ender opp som en teknisk billett. Den sitter i kor i 6-8 uker. Gapet forblir apent.
AI-assistert monstergenerering
Det er en raskere mate. Beskriv monsteret med vanlige ord. Fa tilbake en fungerende regex.
Trinn:
- Apne byggeren for tilpassede enheter
- Gi eksempler: "Vare MRN-er ser slik ut: MRN:1234567, MRN:9876543, MRN:0001234"
- AI bygger regelen: MRN:\d{7}
- Test pa 10 eksempelregistre
- Alle MRN-er funnet? Lagre og distribuer.
For et nettverk med fire MRN-formater:
- Memorial Hospital -> MRN:\d{7}
- St. Mary's -> PT-\d{5}
- University Hospital -> UHN-[A-Z0-9]{10}
- Klinikk -> C\d{5}
Lag fire tilpassede enheter. Grupper dem i en forhansinnstilling. Kjor pa alle filer. Tid: en ettermiddag.
Se tilpasset MRN-deteksjon i HIPAA-pipelines uten kode for en fullstendig veiledning.
Validering for Safe Harbor
HIPAA Safe Harbor sier at den dekede enheten ma ha ingen "faktisk kunnskap" om at data kan identifisere noen. (45 CFR §164.514(b))
Validering viser at de tilpassede reglene dine dekker alle 18 ID-typer.
Trinn 1: Hent eksempler. Fa 100 registre fra hvert nettsted. Bland tidsperioder og avdelinger.
Trinn 2: Kjor deteksjon. Behandle alle 400 dokumenter med de tilpassede reglene dine.
Trinn 3: Menneskelig kontroll. Gjennom ga 20 dokumenter for hand (5 % utvalg). Se etter savnede MRN-er og feil treff.
Trinn 4: Juster regler. Savnede MRN-er? Utvid monsteret. For mange feil treff? Legg til ordgrenser.
Trinn 5: Skriv det ned. Logg regelen, utvalgsstorrelsen, resultatene og datoen. Denne loggen er din Safe Harbor-post.
Se forklarbar redigering og HIPAA-revisjonsspor for mer om hva som skal dokumenteres.
Full Safe Harbor-dekning
Etter a ha utbedret MRN-deteksjon, kontroller alle 18 kategorier.
| Kategori | Standard verktoy | Tilpasning nodvendig? |
|---|---|---|
| 1. Navn | NER-modell | Nei |
| 2. Geografiske data | Stedsdeteksjon | Nei for stat; Ja for stedskoder |
| 3. Datoer | Datodeteksjon | Nei |
| 4. Telefonnumre | Telefondeteksjon | Nei |
| 5. Faksnumre | Telefondeteksjon | Nei |
| 6. E-postadresser | E-postdeteksjon | Nei |
| 7. Personnumre | Personnummerdeteksjon | Nei |
| 8. Medisinske journalnumre | Ikke innebygd | Ja - nettstedsspesifikk |
| 9. Helseplanmedlemsnumre | Delvis | Ofte ja - betalerespesifikk |
| 10. Kontonumre | Delvis | Ofte ja - faktureringsformat |
| 11. Lisensnumre | Delvis | Ofte ja - statsspecifikk |
| 12. Kjoretoys-ID-er | Delvis | Sjelden i kliniske dokumenter |
| 13. Enhets-ID-er | Delvis | Ja hvis enheter er i registre |
| 14. Web-URL-er | URL-deteksjon | Nei |
| 15. IP-adresser | IP-deteksjon | Nei |
| 16. Biometriske ID-er | Tekstkontekst | Sjelden i utskrivningsnotater |
| 17. Bilder | Kun bilde | Utenfor omfang for tekst |
| 18. Andre unike ID-er | Ikke innebygd | Ja - nettstedsspesifikk |
For klinisk tekst trenger kategoriene 8, 9, 10 og 18 oftest tilpasset oppsett.
Klinisk dokumentkontekst
Utskrivningsnotater, kliniske notater og operasjonsrapporter er de viktigste filene som deles for forskning. De inneholder:
- MRN-er i topptekst og bunntekst
- Kontonumre i faktureringsavsnitt
- Datoer for alle hendelser - innleggelse, prosedyre, lab, medisiner
- Legenavn og DEA-numre
- Henvisningslege-informasjon
- Forsikringsmedlems-ID-er
Tilpassede regler for nettstedsspesifikke formater pares med innebygde regler for standardformater. Det paret gir deg full Safe Harbor-dekning.
Konklusjon
HIPAA-anonymisering uten tilpassede regler er ikke Safe Harbor-anonymisering. Hvert sykehus har et unikt MRN-format. Standard verktoy mangler dem. Samsvarsmangler er reelle og forblir apne til du lukker dem.
AI-monstergenerering kutter losningen fra 6-8 ukers teknisk arbeid til en ettermiddag med samsvarsarbeid. Beskriv formatet. Test det pa ekte registre. Distribuer det. Ferdig.