By · Last updated 2026-05-30

Tillbaka till BloggenHälsovård

HIPAA: detektering av sjukhusspecifika MRN-format

HIPAA Safe Harbor kräver borttagning av journalnummer, men MRN-format är inte standardiserade. Epic, Cerner och Meditech använder alla olika format.

May 30, 20267 min läsning
HIPAA Safe Harbormedical record numbersMRN detectionhealthcare compliancecustom PII patterns

Uppdaterat 2026

HIPAA Safe Harbor de-identifiering: detektera sjukhusspecifika MRN-format utan teknisk intervention

HIPAA Safe Harbor kräver borttagning av journalnummer. Det är en av de 18 obligatoriska ID-typerna. Det låter enkelt. Problemet är att MRN-format inte är standardiserade.

Epic använder ett format. Cerner ett annat. Meditech ytterligare ett. Varje sjukhus lägger till sina egna koder. Regionala hälsovårdsnätverk skapar fler. Ett standard-PII-verktyg kan inte känna till ditt format. Det kommer inte att fånga dina MRN:er.

Detta är inte en marginalrisk. IT-team inom hälso- och sjukvård hittar ofta MRN:er kvar i dataset som borde ha de-identifierats. Verktyget konfigurerades bara för vanliga PII-typer.

Problemet med MRN-format

USA har ingen nationell standard för journalnummer. Varje sjukhus eller EHR-leverantör definierar sitt eget format.

Vanliga mönster som observerats:

  • Epic-stil: Numerisk 8-12 siffror (t.ex. 123456789)
  • Cerner-stil: Sjukhuskodprefix + numerisk (t.ex. MGH-987654)
  • Regionala nätverk: Anläggningskod + år + sekvens (t.ex. HOSP-2023-456789)
  • Veterans Affairs: 9 siffror med en kontrollsiffra
  • Pediatriska system: Patienttypprefix + numerisk (t.ex. PED-12345678)

Ingen enskild regel matchar alla dessa format. Det finns inget universellt MRN-mönster.

Vad standard-PII-verktyg detekterar: De flesta HIPAA-verktyg fokuserar på ID:n med fasta format. SSN-koder följer formatet XXX-XX-XXXX. Telefonnummer följer XXX-XXX-XXXX. E-postadresser har en tydlig form. Dessa är lätta att hitta.

MRN:er, kontonummer och licensnummer är HIPAA-typerna 8, 10 och 11. Dessa varierar per sjukhus. De behöver anpassad konfiguration. Ett generellt verktyg kommer inte att fånga dem.

Efterlevnadsgapet

Ett regionalt sjukhus vill dela patientdata med en universitetsforskningspartner. Deras EHR använder detta MRN-format: HOSP-ÅÅÅÅ-XXXXXX.

De bearbetar data med sitt HIPAA-verktyg. Verktyget tar bort namn, datum, telefonnummer och personnummer. Det tar inte bort MRN:er. HOSP-2023-456789 matchar ingen fördefinierad regel.

Forskaren tar emot datasetet. De sammanfogar det med sina egna register. Dessa register innehåller MRN:er från tidigare rapporter från samma sjukhus. Många patienter kan nu återidentifieras. Sjukhuset har begått en HIPAA-överträdelse.

Detta är ett verkligt fallmönster. Se även HIPAA Safe Harbor de-identifiering för medicinsk forskning för mer information om var Safe Harbor brister.

Lösningen: skapa anpassade enheter

Lösningen är att definiera ditt eget MRN-format som en anpassad enhet. En efterlevnadsansvarig kan göra detta. Ingen teknisk intervention krävs.

Steg:

  1. Beskriv formatet: "Börjar med HOSP, sedan ett bindestreck, ett 4-siffrigt år, ett bindestreck och ett 6-siffrigt nummer"

  2. Använd ett AI-verktyg för att generera regex: HOSP-\\d{4}-\\d{6}

  3. Testa det på 20 utskrivningsrapporter. Verifiera att det fångar alla MRN:er.

  4. Spara det som en anpassad enhet med namnet "Hospital MRN"

  5. Lägg till det i din HIPAA-preset tillsammans med de 17 standard-ID-typerna

Denna process tar en efterlevnadsansvarig ungefär 3 timmar. Att skriva anpassad kod kan ta 3 månader.

Exempel: sjukhuskedja med 15 anläggningar

Organisation: Regionalt sjukhuskedja med 15 anläggningar

MRN-format: HOSP-ÅÅÅÅ-XXXXXX (i tusentals PDF-utskrivningsrapporter)

Mål: Dela ett forskningsdataset med en universitetspartner inom ramen för ett HIPAA-dataanvändningsavtal

Gammalt tillvägagångssätt: Extern de-identifieringsleverantör för 120 000 dollar per år

Identifierat gap: Leverantörens verktyg detekterade inte det institutionsspecifika MRN-formatet

Nytt arbetsflöde:

  1. Efterlevnadsansvarig definierar MRN-mönstret — 20 minuter
  2. AI validerar regex — 5 minuter
  3. Testar på 50 provrapporter — 30 minuter
  4. Verifierar att inga MRN:er kvarstår, inga falska positiva — 10 minuter
  5. Lägger till anpassad enhet i HIPAA-preseten
  6. Batchbearbetar hela datasetet med 50 000 poster

Total tid för att täppa till gapet: en eftermiddag.

Multi-anläggningsnätverk: flera MRN-format

Sjukhuskedjor som uppstått genom fusioner hanterar ofta flera EHR-system. Varje äldre system kan använda ett annat MRN-format.

Hur man hanterar det:

Skapa en separat anpassad enhet för varje format:

  • "MRN-format A (Epic)" — 8-siffrigt numeriskt
  • "MRN-format B (äldre Cerner)" — prefix + 7-siffrigt numeriskt
  • "MRN-format C (förvärvad filial)" — statskod + år + sekvens

En enda preset innehåller alla tre anpassade enheter plus standard HIPAA-ID-typerna. Varje dokument från varje anläggning får sina MRN:er borttagna.

Se anpassad MRN-detektering i HIPAA-pipelines utan kod för en steg-för-steg-guide till denna konfiguration med flera format.

Bortom MRN:er: andra icke-standardiserade identifierare

Samma tillvägagångssätt fungerar för andra HIPAA Safe Harbor-ID-typer.

Hälsoplansnummer (Kategori 9): Varje försäkringsgivare använder sitt eget format. Aetna, Blue Cross och United Healthcare ser alla olika ut. Ett faktureringsteam behöver ett anpassat mönster för varje betalare.

Kontonummer (Kategori 10): Sjukhusfaktureringskontonummer varierar per sjukhus.

Licensnummer (Kategori 11): DEA-nummer har ett federalt standardformat. Statliga läkarlicensnummer gör det inte. Varje statlig nämnd använder sitt eget format.

Enhetsidentifierare (Kategori 14): Medicintekniska produkters serienummer definieras av varje tillverkare.

För var och en av dessa täpper en anpassad enhet till gapet. Inga ingenjörer krävs.

Se anpassade PII-identifierare för organisatorisk anonymisering för mer om icke-standardiserade ID-typer.

Validering: bevisa Safe Harbor-efterlevnad

HIPAA Safe Harbor anger att den täckta enheten inte ska ha "faktisk kunskap" om att data kan identifiera någon. (45 CFR §164.514(b)(1))

Validering av anpassade enheter visar att alla 18 ID-typer är täckta.

Valideringssteg:

  1. Bearbeta 50 till 100 provdokument från forskningsdatasetet
  2. Granska utdata — finns det något som ser ut som ett ID?
  3. Kör ett andra detekteringspass för att fånga eventuella missar
  4. Dokumentera vad du gjort

Din konfiguration av anpassade enheter, provgranskning och bearbetningsloggar utgör ditt Safe Harbor-register.

Slutsats

Standard-PII-verktyg med standardinställningar slutför inte HIPAA Safe Harbor de-identifiering. Journalnummer är sjukhusspecifika. De kräver anpassad detektering.

Att skapa anpassade enheter täpper till gapet på några timmar. Efterlevnadsansvariga kan definiera mönstret, testa det och bearbeta data. Ingen teknisk intervention krävs.

Klyftan mellan "vi använde ett HIPAA-verktyg" och "vi tog bort alla 18 Safe Harbor-identifierare" är ofta bara en enda saknad anpassad enhet.

Källor

Redo att skydda din data?

Börja anonymisera PII med 285+ entitetstyper på 48 språk.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.