Uppdaterat 2026
HIPAA Safe Harbor de-identifiering: detektera sjukhusspecifika MRN-format utan teknisk intervention
HIPAA Safe Harbor kräver borttagning av journalnummer. Det är en av de 18 obligatoriska ID-typerna. Det låter enkelt. Problemet är att MRN-format inte är standardiserade.
Epic använder ett format. Cerner ett annat. Meditech ytterligare ett. Varje sjukhus lägger till sina egna koder. Regionala hälsovårdsnätverk skapar fler. Ett standard-PII-verktyg kan inte känna till ditt format. Det kommer inte att fånga dina MRN:er.
Detta är inte en marginalrisk. IT-team inom hälso- och sjukvård hittar ofta MRN:er kvar i dataset som borde ha de-identifierats. Verktyget konfigurerades bara för vanliga PII-typer.
Problemet med MRN-format
USA har ingen nationell standard för journalnummer. Varje sjukhus eller EHR-leverantör definierar sitt eget format.
Vanliga mönster som observerats:
- Epic-stil: Numerisk 8-12 siffror (t.ex. 123456789)
- Cerner-stil: Sjukhuskodprefix + numerisk (t.ex. MGH-987654)
- Regionala nätverk: Anläggningskod + år + sekvens (t.ex. HOSP-2023-456789)
- Veterans Affairs: 9 siffror med en kontrollsiffra
- Pediatriska system: Patienttypprefix + numerisk (t.ex. PED-12345678)
Ingen enskild regel matchar alla dessa format. Det finns inget universellt MRN-mönster.
Vad standard-PII-verktyg detekterar: De flesta HIPAA-verktyg fokuserar på ID:n med fasta format. SSN-koder följer formatet XXX-XX-XXXX. Telefonnummer följer XXX-XXX-XXXX. E-postadresser har en tydlig form. Dessa är lätta att hitta.
MRN:er, kontonummer och licensnummer är HIPAA-typerna 8, 10 och 11. Dessa varierar per sjukhus. De behöver anpassad konfiguration. Ett generellt verktyg kommer inte att fånga dem.
Efterlevnadsgapet
Ett regionalt sjukhus vill dela patientdata med en universitetsforskningspartner. Deras EHR använder detta MRN-format: HOSP-ÅÅÅÅ-XXXXXX.
De bearbetar data med sitt HIPAA-verktyg. Verktyget tar bort namn, datum, telefonnummer och personnummer. Det tar inte bort MRN:er. HOSP-2023-456789 matchar ingen fördefinierad regel.
Forskaren tar emot datasetet. De sammanfogar det med sina egna register. Dessa register innehåller MRN:er från tidigare rapporter från samma sjukhus. Många patienter kan nu återidentifieras. Sjukhuset har begått en HIPAA-överträdelse.
Detta är ett verkligt fallmönster. Se även HIPAA Safe Harbor de-identifiering för medicinsk forskning för mer information om var Safe Harbor brister.
Lösningen: skapa anpassade enheter
Lösningen är att definiera ditt eget MRN-format som en anpassad enhet. En efterlevnadsansvarig kan göra detta. Ingen teknisk intervention krävs.
Steg:
-
Beskriv formatet: "Börjar med HOSP, sedan ett bindestreck, ett 4-siffrigt år, ett bindestreck och ett 6-siffrigt nummer"
-
Använd ett AI-verktyg för att generera regex: HOSP-\\d{4}-\\d{6}
-
Testa det på 20 utskrivningsrapporter. Verifiera att det fångar alla MRN:er.
-
Spara det som en anpassad enhet med namnet "Hospital MRN"
-
Lägg till det i din HIPAA-preset tillsammans med de 17 standard-ID-typerna
Denna process tar en efterlevnadsansvarig ungefär 3 timmar. Att skriva anpassad kod kan ta 3 månader.
Exempel: sjukhuskedja med 15 anläggningar
Organisation: Regionalt sjukhuskedja med 15 anläggningar
MRN-format: HOSP-ÅÅÅÅ-XXXXXX (i tusentals PDF-utskrivningsrapporter)
Mål: Dela ett forskningsdataset med en universitetspartner inom ramen för ett HIPAA-dataanvändningsavtal
Gammalt tillvägagångssätt: Extern de-identifieringsleverantör för 120 000 dollar per år
Identifierat gap: Leverantörens verktyg detekterade inte det institutionsspecifika MRN-formatet
Nytt arbetsflöde:
- Efterlevnadsansvarig definierar MRN-mönstret — 20 minuter
- AI validerar regex — 5 minuter
- Testar på 50 provrapporter — 30 minuter
- Verifierar att inga MRN:er kvarstår, inga falska positiva — 10 minuter
- Lägger till anpassad enhet i HIPAA-preseten
- Batchbearbetar hela datasetet med 50 000 poster
Total tid för att täppa till gapet: en eftermiddag.
Multi-anläggningsnätverk: flera MRN-format
Sjukhuskedjor som uppstått genom fusioner hanterar ofta flera EHR-system. Varje äldre system kan använda ett annat MRN-format.
Hur man hanterar det:
Skapa en separat anpassad enhet för varje format:
- "MRN-format A (Epic)" — 8-siffrigt numeriskt
- "MRN-format B (äldre Cerner)" — prefix + 7-siffrigt numeriskt
- "MRN-format C (förvärvad filial)" — statskod + år + sekvens
En enda preset innehåller alla tre anpassade enheter plus standard HIPAA-ID-typerna. Varje dokument från varje anläggning får sina MRN:er borttagna.
Se anpassad MRN-detektering i HIPAA-pipelines utan kod för en steg-för-steg-guide till denna konfiguration med flera format.
Bortom MRN:er: andra icke-standardiserade identifierare
Samma tillvägagångssätt fungerar för andra HIPAA Safe Harbor-ID-typer.
Hälsoplansnummer (Kategori 9): Varje försäkringsgivare använder sitt eget format. Aetna, Blue Cross och United Healthcare ser alla olika ut. Ett faktureringsteam behöver ett anpassat mönster för varje betalare.
Kontonummer (Kategori 10): Sjukhusfaktureringskontonummer varierar per sjukhus.
Licensnummer (Kategori 11): DEA-nummer har ett federalt standardformat. Statliga läkarlicensnummer gör det inte. Varje statlig nämnd använder sitt eget format.
Enhetsidentifierare (Kategori 14): Medicintekniska produkters serienummer definieras av varje tillverkare.
För var och en av dessa täpper en anpassad enhet till gapet. Inga ingenjörer krävs.
Se anpassade PII-identifierare för organisatorisk anonymisering för mer om icke-standardiserade ID-typer.
Validering: bevisa Safe Harbor-efterlevnad
HIPAA Safe Harbor anger att den täckta enheten inte ska ha "faktisk kunskap" om att data kan identifiera någon. (45 CFR §164.514(b)(1))
Validering av anpassade enheter visar att alla 18 ID-typer är täckta.
Valideringssteg:
- Bearbeta 50 till 100 provdokument från forskningsdatasetet
- Granska utdata — finns det något som ser ut som ett ID?
- Kör ett andra detekteringspass för att fånga eventuella missar
- Dokumentera vad du gjort
Din konfiguration av anpassade enheter, provgranskning och bearbetningsloggar utgör ditt Safe Harbor-register.
Slutsats
Standard-PII-verktyg med standardinställningar slutför inte HIPAA Safe Harbor de-identifiering. Journalnummer är sjukhusspecifika. De kräver anpassad detektering.
Att skapa anpassade enheter täpper till gapet på några timmar. Efterlevnadsansvariga kan definiera mönstret, testa det och bearbeta data. Ingen teknisk intervention krävs.
Klyftan mellan "vi använde ett HIPAA-verktyg" och "vi tog bort alla 18 Safe Harbor-identifierare" är ofta bara en enda saknad anpassad enhet.