By · Last updated 2026-06-03

Tilbake til BloggHelsevesen

HIPAA MRN-deteksjon uten regex-doktorgrad

Hvert sykehus har sitt eget MRN-format. Memorial bruker MRN:XXXXXXX, St. Mary's bruker PT-YYYYY, University Hospital bruker UHN-XXXXXXXXXX.

June 3, 20266 min lesing
HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

HIPAA MRN-deteksjon uten regex-doktorgrad

Sykehusets MRN-format finnes ikke i noe standard PII-verktoy. Slik legger du det til pa fem minutter. Ingen kode nodvendig.

IT-team i helsevesenet stater overfor et HIPAA-problem som andre sektorer ikke har. Den ID-en de mest trenger a finne - medisinsk journalnummer - er satt av sitt eget sykehus. Det finnes ingen nasjonal standard.

Hvert HIPAA-anonymiseringsprosjekt trenger tilpasset oppsett. Uten det slipper MRN-er gjennom "anonymiserte" filer uoppdaget.

MRN-problemet med flere fasiliteter

Sykehusnett bygd gjennom fusjoner har eldre EHR-systemer. Hvert system har sitt eget MRN-format:

  • Memorial Hospital (Epic): MRN:XXXXXXX - 7-sifret tall med prefiks
  • St. Mary's (Cerner): PT-YYYYY - 5-sifret med pasientprefiks
  • University Hospital (Meditech): UHN-XXXXXXXXXX - 10-tegns blanding
  • Klinikk (frittstenende EMR): C\d{5} - bokstaven C pluss 5 sifre

HIPAA Safe Harbor krever fjerning av alle 18 ID-typer. Kategori 8 er medisinske journalnumre. Et verktoy som ikke kjenner formatet ditt vil mangle dem. Filen ser ren ut. Den er det ikke.

ServiceNow-helsefellesskapet har pekt pa dette noyaktige problemet. Standard verktoy fanger opp personnumre og telefonnumre. De mangler fasilitets-MRN-er hver gang.

Regex-barrieren

A legge til tilpassede regler i Microsoft Presidio - den apne kilden til mange HIPAA-verktoy - krever ekte ferdigheter:

  • Du ma kjenne PatternRecognizer-klassen
  • Du ma skrive regex i Python-syntaks
  • Du ma sette opp YAML-konfigurasjonsfiler
  • Du ma stille inn konfidenspoeng
  • Du ma teste og feilsoke Python-skript

En samsvarsansvarlig som kjenner MRN-formatet kan ikke gjore dette alene. Losningen ender opp som en teknisk billett. Den sitter i kor i 6-8 uker. Gapet forblir apent.

AI-assistert monstergenerering

Det er en raskere mate. Beskriv monsteret med vanlige ord. Fa tilbake en fungerende regex.

Trinn:

  1. Apne byggeren for tilpassede enheter
  2. Gi eksempler: "Vare MRN-er ser slik ut: MRN:1234567, MRN:9876543, MRN:0001234"
  3. AI bygger regelen: MRN:\d{7}
  4. Test pa 10 eksempelregistre
  5. Alle MRN-er funnet? Lagre og distribuer.

For et nettverk med fire MRN-formater:

  • Memorial Hospital -> MRN:\d{7}
  • St. Mary's -> PT-\d{5}
  • University Hospital -> UHN-[A-Z0-9]{10}
  • Klinikk -> C\d{5}

Lag fire tilpassede enheter. Grupper dem i en forhansinnstilling. Kjor pa alle filer. Tid: en ettermiddag.

Se tilpasset MRN-deteksjon i HIPAA-pipelines uten kode for en fullstendig veiledning.

Validering for Safe Harbor

HIPAA Safe Harbor sier at den dekede enheten ma ha ingen "faktisk kunnskap" om at data kan identifisere noen. (45 CFR §164.514(b))

Validering viser at de tilpassede reglene dine dekker alle 18 ID-typer.

Trinn 1: Hent eksempler. Fa 100 registre fra hvert nettsted. Bland tidsperioder og avdelinger.

Trinn 2: Kjor deteksjon. Behandle alle 400 dokumenter med de tilpassede reglene dine.

Trinn 3: Menneskelig kontroll. Gjennom ga 20 dokumenter for hand (5 % utvalg). Se etter savnede MRN-er og feil treff.

Trinn 4: Juster regler. Savnede MRN-er? Utvid monsteret. For mange feil treff? Legg til ordgrenser.

Trinn 5: Skriv det ned. Logg regelen, utvalgsstorrelsen, resultatene og datoen. Denne loggen er din Safe Harbor-post.

Se forklarbar redigering og HIPAA-revisjonsspor for mer om hva som skal dokumenteres.

Full Safe Harbor-dekning

Etter a ha utbedret MRN-deteksjon, kontroller alle 18 kategorier.

KategoriStandard verktoyTilpasning nodvendig?
1. NavnNER-modellNei
2. Geografiske dataStedsdeteksjonNei for stat; Ja for stedskoder
3. DatoerDatodeteksjonNei
4. TelefonnumreTelefondeteksjonNei
5. FaksnumreTelefondeteksjonNei
6. E-postadresserE-postdeteksjonNei
7. PersonnumrePersonnummerdeteksjonNei
8. Medisinske journalnumreIkke innebygdJa - nettstedsspesifikk
9. HelseplanmedlemsnumreDelvisOfte ja - betalerespesifikk
10. KontonumreDelvisOfte ja - faktureringsformat
11. LisensnumreDelvisOfte ja - statsspecifikk
12. Kjoretoys-ID-erDelvisSjelden i kliniske dokumenter
13. Enhets-ID-erDelvisJa hvis enheter er i registre
14. Web-URL-erURL-deteksjonNei
15. IP-adresserIP-deteksjonNei
16. Biometriske ID-erTekstkontekstSjelden i utskrivningsnotater
17. BilderKun bildeUtenfor omfang for tekst
18. Andre unike ID-erIkke innebygdJa - nettstedsspesifikk

For klinisk tekst trenger kategoriene 8, 9, 10 og 18 oftest tilpasset oppsett.

Klinisk dokumentkontekst

Utskrivningsnotater, kliniske notater og operasjonsrapporter er de viktigste filene som deles for forskning. De inneholder:

  • MRN-er i topptekst og bunntekst
  • Kontonumre i faktureringsavsnitt
  • Datoer for alle hendelser - innleggelse, prosedyre, lab, medisiner
  • Legenavn og DEA-numre
  • Henvisningslege-informasjon
  • Forsikringsmedlems-ID-er

Tilpassede regler for nettstedsspesifikke formater pares med innebygde regler for standardformater. Det paret gir deg full Safe Harbor-dekning.

Konklusjon

HIPAA-anonymisering uten tilpassede regler er ikke Safe Harbor-anonymisering. Hvert sykehus har et unikt MRN-format. Standard verktoy mangler dem. Samsvarsmangler er reelle og forblir apne til du lukker dem.

AI-monstergenerering kutter losningen fra 6-8 ukers teknisk arbeid til en ettermiddag med samsvarsarbeid. Beskriv formatet. Test det pa ekte registre. Distribuer det. Ferdig.

Kilder

Klar til å beskytte dataene dine?

Begynn å anonymisere PII med 285+ enhetstyper på 48 språk.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.