anonym.legal

By · Last updated 2026-06-04

Terug na BlogGesondheidsorg

HIPAA MRN-opsporing sonder 'n Regex-doktorsgraad

Elke hospitaal se MRN-formaat is anders. Memorial gebruik MRN:XXXXXXX, St. Mary's gebruik PT-YYYYY, University Hospital gebruik UHN-XXXXXXXXXX.

June 4, 20266 min lees
HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

HIPAA MRN-opsporing sonder 'n Regex-doktorsgraad

U hospitaal se MRN-formaat is nie in enige standaard PII-nutsmiddel nie. Hier is hoe u dit in vyf minute kan byvoeg. Geen kode benodig nie.

Gesondheidsorg-IT-spanne staan voor 'n HIPAA-probleem wat ander sektore nie het nie. Die ID wat hulle die meeste moet vind - die mediese rekordnommer - word deur hul eie hospitaal vasgestel. Geen nasionale standaard bestaan nie.

Elke HIPAA de-ID-projek benodig persoonlike opstelling. Sonder dit gly MRN's deur "de-geidentifiseerde" leers onopgemerk.

Die Multi-Fasiliteit MRN-probleem

Hospitaalnetwerke wat deur sameswerings gebou is, het erfenis-EHR-stelsels. Elke stelsel het sy eie MRN-formaat:

  • Memorial Hospital (Epic): MRN:XXXXXXX - 7-syfer nommer met voorvoegsel
  • St. Mary's (Cerner): PT-YYYYY - 5-syfer met pasientvoorvoegsel
  • University Hospital (Meditech): UHN-XXXXXXXXXX - 10-karakter mengsel
  • Kliniek (selfstandige EMR): C\d{5} - letter C plus 5 syfers

HIPAA Safe Harbor vereis die verwydering van alle 18 ID-tipes. Kategorie 8 is mediese rekordnommers. 'n Nutsmiddel wat nie u formaat ken nie, sal dit mis. Die leer lyk skoon. Dit is nie.

Die ServiceNow-gesondheidsorggemeenskap het hierdie presiese kwessie opgemerk. Standaardnutsmiddels vang SSN's en telefoonnommers. Hulle mis fasiliteit-MRN's elke keer.

Die Regex-versperring

Die byvoeging van persoonlike reels aan Microsoft Presidio - die oopbron-basis vir baie HIPAA-nutsmiddels - vereis werklike vaardigheid:

  • U moet die PatternRecognizer-klas ken
  • U moet regex in Python-sintaksis skryf
  • U moet YAML-konfigleers opstel
  • U moet betroubaarheidspunte stel
  • U moet Python-skrifte toets en ontfout

'n Voldoeningsbeampte wat die MRN-formaat ken, kan dit nie alleen doen nie. Die oplossing eindig as 'n ingenieurskaartjie. Dit sit in die waglys vir 6-8 weke. Die gaping bly oop.

KI-gesteunde patroonopwekking

There is 'n vinniger manier. Beskryf die patroon in gewone woorde. Kry 'n werkende regex terug.

Stappe:

  1. Maak die persoonlike entiteitbouer oop
  2. Gee voorbeelde: "Ons MRN's lyk so: MRN:1234567, MRN:9876543, MRN:0001234"
  3. KI bou die reel: MRN:\d{7}
  4. Toets op 10 voorbeeldrekords
  5. Alle MRN's gevind? Stoor en plaas.

Vir 'n netwerk met vier MRN-formate:

  • Memorial Hospital - MRN:\d{7}
  • St. Mary's - PT-\d{5}
  • University Hospital - UHN-[A-Z0-9]{10}
  • Kliniek - C\d{5}

Maak vier persoonlike entiteite. Groepeer hulle in 'n voorinstelling. Laat loop op alle leers. Tyd: een middag.

Sien persoonlike MRN-opsporing in HIPAA-pyplyne sonder kode vir 'n volledige hoe-om-gids.

Validasie vir Safe Harbor

HIPAA Safe Harbor se die gedekte entiteit moet geen "werklike kennis" he dat die data iemand kan identifiseer nie. (45 CFR §164.514(b))

Validasie wys dat u persoonlike reels alle 18 ID-tipes dek.

Stap 1: Trek steekproewe. Kry 100 rekords van elke perseel. Meng tydperke en departemente.

Stap 2: Laat opsporing loop. Verwerk alle 400 dokumente met u persoonlike reels.

Stap 3: Menslike kontrole. Hersien 20 dokumente met die hand (5% steekproef). Soek na gemiste MRN's en valse treffers.

Stap 4: Verfyn reels. Gemiste MRN's? Verbreed die patroon. Te veel valse treffers? Voeg woordgrenslyne by.

Stap 5: Skryf dit neer. Teken die reel, die steekproefgrootte, die resultate en die datum aan. Hierdie log is u Safe Harbor-rekord.

Sien verklaarbare redigering en HIPAA-ouditspore vir meer oor wat om te dokumenteer.

Volledige Safe Harbor-dekking

Na die regstelling van MRN-opsporing, kontroleer alle 18 kategoriee.

KategorieStandaardnutsmiddelsPersoonlike opstelling benodig?
1. NameNER-modelNee
2. Geografiese dataLiggingopsporingNee vir staat; Ja vir perseeelkodes
3. DatumsDatumsopsporingNee
4. TelefoonnommersTelefoonopsporingNee
5. Faks nommersTelefoonopsporingNee
6. E-posadresseE-posopsporingNee
7. SSN'sSSN-opsporingNee
8. Mediese rekordnommersNie ingeboude nieJa - perseel-spesifiek
9. Gesondheidsplan-lede nommersGedeeltelikDikwels ja - betaler-spesifiek
10. RekeningnommersGedeeltelikDikwels ja - faktureringsformaat
11. LisensienommersGedeeltelikDikwels ja - staat-spesifiek
12. Voertuig-ID'sGedeeltelikSeldsaam in kliniese dokumente
13. Toestel-ID'sGedeeltelikJa as toestelle in rekords is
14. Web-URL'sURL-opsporingNee
15. IP-adresseIP-opsporingNee
16. Biometriese ID'sTekskonteksSeldsaam in ontslagnotas
17. FotosSlegs beeldBuite bestek vir teks
18. Ander unieke ID'sNie ingeboude nieJa - perseel-spesifiek

Vir kliniese teks benodig kategoriee 8, 9, 10 en 18 dikwels persoonlike opstelling.

Kliniese dokumentkonteks

Ontslagnotas, kliniese notas en operasie-verslae is die hoofleers wat vir navorsing gedeel word. Hulle hou:

  • MRN's in opskrifte en voetskrifte
  • Rekeningnommers in faktureringsdele
  • Datums vir alle gebeure - toelating, prosedure, laboratorium, medisyne
  • Geneesheername en DEA-nommers
  • Verwysende doktersinligting
  • Versekerings-lede-ID's

Persoonlike reels vir perseel-spesifieke formate koppel saam met ingeboude reels vir standaardformate. Hierdie paar gee u volledige Safe Harbor-dekking.

Gevolgtrekking

HIPAA de-ID sonder persoonlike reels is nie Safe Harbor de-ID nie. Elke hospitaal se MRN-formaat is uniek. Standaardnutsmiddels mis dit. Die voldoeningsgaping is werklik en dit bly oop totdat u dit toemaak.

KI-patroonopwekking sny die oplossing van 6-8 weke ingenieurswese tot een middag van voldoeningswerk. Beskryf die formaat. Toets dit op werklike rekords. Plaas dit. Klaar.

Bronne

Gereed om u data te beskerm?

Begin om PII te anonimiseer met 285+ entiteitstipes in 48 tale.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.