Tilbake til BloggHelsevesen

Egendefinert MRN-detektering uten kode...

Medisinske journalnumre er sykehus-spesifikke — hvert helsevesen bruker et annet format. HIPAA Safe Harbor krever fjerning av MRN-er.

April 19, 20268 min lesing
custom MRN detectionHIPAA pipeline configurationno-code regexAI pattern helperhospital identifier de-identification

Problemet med fragmentering av MRN-format

USA har omtrent 6 100 sykehus, hver med sitt eget elektroniske helseregistreringssystem med sitt eget format for medisinske journalnumre. Det finnes ingen nasjonal standard for MRN. Joint Commission, som akkrediterer helseorganisasjoner, spesifiserer at MRN-er må identifisere pasienter unikt innen et system — men spesifiserer ikke formatet.

Konsekvensen: MRN-formater i bruk inkluderer 7-sifrede heltall, 8-sifrede heltall, alfanumeriske strenger av varierende lengde, formaterte strenger med prefiks-koder (HOSP-, MRN-, PT-, PAT-), institusjonelle koder som er forhåndsinnstilt (SVHS-, CHOP-, MDACC-), og dato-kodede formater der registreringsåret er innebygd i nummeret.

HIPAA's Safe Harbor-de-identifikasjonsmetode lister medisinske journalnumre som kategori 8 av 18 identifikatorer som må fjernes (45 CFR Seksjon 164.514(b)(2)). Kravet er ikke kvalifisert etter format — alle MRN-formater som brukes av organisasjonen må oppdages og fjernes. En organisasjon som behandler kliniske notater uten å oppdage sitt spesifikke MRN-format oppnår ikke HIPAA Safe Harbor-de-identifikasjon uansett hvilke andre identifikatorer som fjernes.

Kodingbarrieren

Den standard tilnærmingen for å legge til et egendefinert MRN-format til en de-identifikasjons-pipeline krever implementering av formatet i Presidio's egendefinerte gjenkjenningsrammeverk. Dette innebærer:

Å skrive en Python-klasse som utvider EntityRecognizer, definere regex-mønsteret for det spesifikke MRN-formatet, implementere analyze()-metoden som anvender mønsteret, legge gjenkjenningsverktøyet til Presidio-registeret, teste implementeringen mot representative prøver, og vedlikeholde implementeringen etter hvert som formatet utvikler seg.

For kliniske informatikateam uten Python-kompetanse — som beskriver flertallet av helsevesenets samsvars- og personvernsansatte — skaper dette en avhengighet av ingeniørteamet for hver formatendring. Ingeniørressurser i helseorganisasjoner tildeles vanligvis EHR-integrasjon og klinisk beslutningsstøtte, ikke konfigurasjon av samsvarsverktøy.

AI Mønsterhjelper

Den AI-assisterte mønsteropprettingsmetoden erstatter kodearbeidsflyten med et veiledet grensesnitt:

Det kliniske informatikateamet åpner Custom Entity Creator i nettapplikasjonen. De gir 5 prøve MRN-verdier fra systemet sitt (SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001). De klikker "Generer mønster." AI-en analyserer prøve-strukturen og returnerer: mønsteret SVHS-d{7} matcher de oppgitte eksemplene; tillitsnivå høyt; foreslått entitetsnavn: HOSPITAL-MRN; foreslått erstatning: [MRN]; test mot ytterligere prøver for å validere.

Teamet gir 5 ytterligere testprøver. Mønsteret valideres korrekt. Den egendefinerte entiteten lagres i HIPAA-samsvarsinnstillingen. Alle påfølgende de-identifikasjonsøkter — nettapplikasjon, Office-tillegg, skrivebordsapp og API — oppdager SVHS-format MRN-er automatisk som en del av den standard PHI-deteksjonsprosessen.

GDPR-forskningsunntaket under artikkel 89 krever pseudonymisering og dataminimering for forskningsdatasett. Egendefinert opprettelse av entiteter sikrer at institusjonsspesifikke identifikatorer er inkludert i pseudonymiseringsomfanget — og lukker dekninggapet som generiske verktøy etterlater for proprietære formater.

Kilder:

Klar til å beskytte dataene dine?

Begynn å anonymisere PII med 285+ enhetstyper på 48 språk.