By · Last updated 2026-06-04

Tilbage til BlogSundhedspleje

HIPAA MRN-detektion uden en regex-doktorgrad

Hvert hospitals MRN-format er forskelligt. Memorial bruger MRN:XXXXXXX, St. Mary's bruger PT-YYYYY, University Hospital bruger UHN-XXXXXXXXXX.

June 4, 20266 min læsning
HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

HIPAA MRN-detektion uden en regex-doktorgrad

Dit hospitals MRN-format er ikke i noget standard PII-værktøj. Sådan tilføjer du det på fem minutter. Ingen kodning nødvendig.

Sundhedsinformatik-teams står over for et HIPAA-problem, som andre sektorer ikke har. Det ID, de mest skal finde — medicinsk journalnummer (MRN) — er fastsat af deres eget hospital. Der findes ingen national standard.

Hvert HIPAA-anonymiseringsprojekt kræver tilpasset opsætning. Uden den glider MRN'er igennem "afidentificerede" filer ubemærket.

Problemet med MRN på tværs af faciliteter

Hospitalsnetværk, der er bygget gennem fusioner, har ældre EPJ-systemer. Hvert system har sit eget MRN-format:

  • Memorial Hospital (Epic): MRN:XXXXXXX — 7-cifret nummer med præfiks
  • St. Mary's (Cerner): PT-YYYYY — 5-cifret med patientpræfiks
  • University Hospital (Meditech): UHN-XXXXXXXXXX — 10-tegns blanding
  • Klinik (selvstændig EPR): C\d{5} — bogstavet C plus 5 cifre

HIPAA Safe Harbor kræver fjernelse af alle 18 ID-typer. Kategori 8 er medicinsk journalnumre. Et værktøj, der ikke kender dit format, vil overse dem. Filen ser ren ud. Det er den ikke.

ServiceNow's sundhedsfællesskab har bemærket dette præcise problem. Standardværktøjer fanger CPR-numre og telefonnumre. De overser facilitets-MRN'er hver gang.

Regex-barrieren

At tilføje tilpassede regler til Microsoft Presidio — open source-grundlaget for mange HIPAA-værktøjer — kræver reel ekspertise:

  • Du skal kende PatternRecognizer-klassen
  • Du skal skrive regex i Python-syntaks
  • Du skal opsætte YAML-konfigurationsfiler
  • Du skal justere konfidensscorer
  • Du skal teste og debugge Python-scripts

En compliance-ansvarlig, der kender MRN-formatet, kan ikke gøre dette alene. Løsningen ender som en engineering-billet. Den ligger i kø i 6–8 uger. Hullet forbliver åbent.

AI-assisteret mønsergenerering

Der er en hurtigere måde. Beskriv mønsteret med almindelige ord. Få en fungerende regex tilbage.

Trin:

  1. Åbn den tilpassede entitetsbuilder
  2. Giv eksempler: "Vores MRN'er ser sådan ud: MRN:1234567, MRN:9876543, MRN:0001234"
  3. AI bygger reglen: MRN:\d{7}
  4. Test på 10 eksempelposter
  5. Alle MRN'er fundet? Gem og implementer.

For et netværk med fire MRN-formater:

  • Memorial Hospital → MRN:\d{7}
  • St. Mary's → PT-\d{5}
  • University Hospital → UHN-[A-Z0-9]{10}
  • Klinik → C\d{5}

Opret fire tilpassede entiteter. Grupper dem i en forudindstilling. Kør på alle filer. Tid: én eftermiddag.

Se tilpasset MRN-detektion i HIPAA-pipelines uden kode for en komplet vejledning.

Validering til Safe Harbor

HIPAA Safe Harbor siger, at den dækkede enhed ikke må have "faktisk viden" om, at dataene kan identificere nogen. (45 CFR §164.514(b))

Validering viser, at dine tilpassede regler dækker alle 18 ID-typer.

Trin 1: Udtræk prøver. Hent 100 poster fra hvert sted. Mix tidsperioder og afdelinger.

Trin 2: Kør detektion. Behandl alle 400 dokumenter med dine tilpassede regler.

Trin 3: Menneskelig kontrol. Gennemgå 20 dokumenter manuelt (5 % stikprøve). Se efter manglende MRN'er og falske resultater.

Trin 4: Finindstil regler. Manglende MRN'er? Udvid mønsteret. For mange falske resultater? Tilføj ordgrænser.

Trin 5: Skriv det ned. Log reglen, prøvestørrelsen, resultaterne og datoen. Denne log er din Safe Harbor-dokumentation.

Se forklarlig redigering og HIPAA-revisionshistorik for mere om, hvad du skal dokumentere.

Fuld Safe Harbor-dækning

Efter at have rettet MRN-detektion, kontrollér alle 18 kategorier.

KategoriStandardværktøjerTilpasning nødvendig?
1. NavneNER-modelNej
2. Geografiske dataStedsdetektionNej for stat; Ja for stedkoder
3. DatoerDatodetektionNej
4. TelefonnumreTelefondetektionNej
5. FaxnumreTelefondetektionNej
6. E-mailadresserE-maildetektionNej
7. CPR-numreCPR-detektionNej
8. Medicinsk journalnummerIkke indbyggetJa — stedsspecifik
9. SundhedsplanmedlemsnumreDelvisOfte ja — betalerspecifik
10. KontonumreDelvisOfte ja — faktureringsformat
11. LicensnumreDelvisOfte ja — statsspecifik
12. Køretøjs-ID'erDelvisSjælden i kliniske dokumenter
13. Enheds-ID'erDelvisJa, hvis enheder er i journaler
14. Web-URL'erURL-detektionNej
15. IP-adresserIP-detektionNej
16. Biometriske ID'erTekstkontekstSjælden i udskrivningsnoter
17. BillederKun billederIkke relevant for tekst
18. Andre unikke ID'erIkke indbyggetJa — stedsspecifik

For klinisk tekst kræver kategorierne 8, 9, 10 og 18 oftest tilpasset opsætning.

Klinisk dokumentkontekst

Udskrivningsnotater, kliniske notater og operationsrapporter er de primære filer, der deles til forskning. De indeholder:

  • MRN'er i sidehoveder og sidefødder
  • Kontonumre i faktureringssektioner
  • Datoer for alle hændelser — indlæggelse, procedure, laboratorium, medicin
  • Lægenavne og DEA-numre
  • Oplysninger om henvisende læge
  • Forsikringsmedlems-ID'er

Tilpassede regler for stedsspecifikke formater parres med indbyggede regler for standardformater. Det par giver dig fuld Safe Harbor-dækning.

Konklusion

HIPAA-afidentificering uden tilpassede regler er ikke Safe Harbor-afidentificering. Hvert hospitals MRN-format er unikt. Standardværktøjer overser dem. Compliancehullet er reelt, og det forbliver åbent, indtil du lukker det.

AI-mønstergenerering reducerer løsningen fra 6–8 ugers engineering til én eftermiddags compliance-arbejde. Beskriv formatet. Test det på rigtige journaler. Implementer det. Færdig.

Kilder

Klar til at beskytte dine data?

Begynd at anonymisere PII med 285+ enhedstyper på tværs af 48 sprog.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.