By · Last updated 2026-06-03

Atpakaļ uz BloguVeselības Aprūpe

HIPAA MRN noteikšana bez regex ekspertīzes

Katras slimnīcas MRN formāts ir atšķirīgs. Memorial izmanto MRN:XXXXXXX, St. Mary's izmanto PT-YYYYY, University Hospital izmanto UHN-XXXXXXXXXX.

June 3, 20266 min lasīšanai
HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

HIPAA MRN noteikšana bez regex ekspertīzes

Jūsu slimnīcas MRN formāts nav nevienā standarta PII rīkā. Lūk, kā to pievienot piecās minūtēs. Bez koda.

Veselības aprūpes IT komandas saskaras ar HIPAA problēmu, kas nav citām nozarēm. ID, ko viņi visvairāk vajag atrast — medicīnas kartītes numurs — ir noteikts pašas slimnīcas. Valsts standarts nepastāv.

Katram HIPAA de-identifikācijas projektam nepieciešama pielāgota iestatīšana. Bez tās MRN izslīd cauri "de-identificētajiem" failiem nepamanīti.

Daudzas iestādes — dažādi MRN formāti

Slimnīcu tīkli, kas veidoti caur apvienošanos, izmanto mantotās EHR sistēmas. Katrai sistēmai ir savs MRN formāts:

  • Memorial Hospital (Epic): MRN:XXXXXXX — 7 ciparu numurs ar prefiksu
  • St. Mary's (Cerner): PT-YYYYY — 5 cipari ar pacienta prefiksu
  • University Hospital (Meditech): UHN-XXXXXXXXXX — 10 rakstzīmju kombinācija
  • Klīnika (atsevišķa EMR): C\d{5} — burts C plus 5 cipari

HIPAA Safe Harbor prasa noņemt visus 18 ID tipus. 8. kategorija ir medicīnas kartītes numuri. Rīks, kas nezina jūsu formātu, tos palaidīs garām. Fails izskatās tīrs. Tas nav.

ServiceNow veselības aprūpes kopiena ir atzīmējusi šo precīzo problēmu. Standarta rīki nosaka sociālās apdrošināšanas numurus un tālruņa numurus. Tie vienmēr palaiž garām iestādes MRN.

Regex barjera

Pielāgotu noteikumu pievienošana Microsoft Presidio — daudziem HIPAA rīkiem atvērtā koda pamatam — prasa reālas prasmes:

  • Jums jāzina PatternRecognizer klase
  • Jums jāraksta regex Python sintaksē
  • Jums jāiestata YAML konfigurācijas faili
  • Jums jāpielāgo ticamības vērtējumi
  • Jums jātestē un jāatkļūdo Python skripti

Atbilstības speciālists, kas zina MRN formātu, to nevar izdarīt viens. Labojums nonāk kā inženieru uzdevums. Tas gaida rindā 6–8 nedēļas. Robs paliek vaļā.

AI palīdzēta paraugu ģenerēšana

Ir ātrāks veids. Aprakstiet paraugu vienkāršos vārdos. Saņemiet darbojošos regex atpakaļ.

Soļi:

  1. Atveriet pielāgotās entītijas veidotāju
  2. Sniedziet piemērus: "Mūsu MRN izskatās šādi: MRN:1234567, MRN:9876543, MRN:0001234"
  3. AI izveido noteikumu: MRN:\d{7}
  4. Pārbaudiet ar 10 parauga ierakstiem
  5. Visi MRN atrasti? Saglabājiet un izvietojiet.

Tīklam ar četriem MRN formātiem:

  • Memorial Hospital → MRN:\d{7}
  • St. Mary's → PT-\d{5}
  • University Hospital → UHN-[A-Z0-9]{10}
  • Klīnika → C\d{5}

Izveido četras pielāgotas entītijas. Grupējiet tās iepriekšiestatījumā. Palaidiet uz visiem failiem. Laiks: viena pēcpusdiena.

Skatiet pielāgota MRN noteikšana HIPAA konveieros bez koda pilnai pamācības rokasgrāmatai.

Validācija Safe Harbor ievērošanai

HIPAA Safe Harbor nosaka, ka pārklātajai entītijai nedrīkst būt faktiskas zināšanas, ka dati varētu identificēt kādu personu. (45 CFR §164.514(b))

Validācija parāda, ka jūsu pielāgotie noteikumi sedz visus 18 ID tipus.

1. solis: Iegūstiet paraugus. Iegūstiet 100 ierakstus no katras iestādes. Sajauciet laika periodus un nodaļas.

2. solis: Palaidiet noteikšanu. Apstrādājiet visus 400 dokumentus ar saviem pielāgotajiem noteikumiem.

3. solis: Cilvēka pārbaude. Pārskatiet 20 dokumentus ar roku (5% paraugs). Meklējiet nokavētus MRN un nepatiesus rezultātus.

4. solis: Uzlabojiet noteikumus. Nokavēti MRN? Paplašiniet paraugu. Pārāk daudz nepatiesu rezultātu? Pievienojiet vārdu robežas.

5. solis: Pierakstiet to. Reģistrējiet noteikumu, parauga lielumu, rezultātus un datumu. Šis žurnāls ir jūsu Safe Harbor ieraksts.

Skatiet izskaidrojama anonimizācija un HIPAA revīzijas pēdas par papildu informāciju, kas jādokumentē.

Pilnīgs Safe Harbor pārklājums

Pēc MRN noteikšanas labošanas pārbaudiet visas 18 kategorijas.

KategorijaStandarta rīkiPielāgots nepieciešams?
1. VārdiNER modelis
2. Ģeogrāfiskie datiAtrašanās vietas noteikšanaNē štata līmenim; Jā iestādes kodiem
3. DatumiDatuma noteikšana
4. Tālruņa numuriTālruņa noteikšana
5. Faksa numuriTālruņa noteikšana
6. E-pasta adresesE-pasta noteikšana
7. Sociālās apdrošināšanas numuriSSN noteikšana
8. Medicīnas kartītes numuriNav iebūvētsJā — iestādes specifisks
9. Veselības plāna biedru numuriDaļējsBieži jā — maksātāja specifisks
10. Konta numuriDaļējsBieži jā — norēķinu formāts
11. Licences numuriDaļējsBieži jā — štata specifisks
12. Transportlīdzekļu IDDaļējsReti klīniskajos dokumentos
13. Ierīces IDDaļējsJā, ja ierīces ir ierakstos
14. Tīmekļa URLURL noteikšana
15. IP adresesIP noteikšana
16. Biometriskie IDTeksta kontekstsReti izrakstu piezīmēs
17. FotogrāfijasTikai attēlsĀrpus teksta apjoma
18. Citi unikālie IDNav iebūvētsJā — iestādes specifisks

Klīniskajam tekstam kategorijas 8, 9, 10 un 18 visbiežāk prasa pielāgotu iestatīšanu.

Klīnisko dokumentu konteksts

Izrakstu piezīmes, klīniskās piezīmes un operāciju pārskati ir galvenie faili, kas tiek kopīgoti pētniecībai. Tajos ir:

  • MRN galvenēs un kājenēs
  • Konta numuri norēķinu sadaļās
  • Datumi visiem notikumiem — uzņemšana, procedūra, laboratorija, zāles
  • Ārstu vārdi un DEA numuri
  • Nosūtošā ārsta informācija
  • Apdrošināšanas biedru ID

Pielāgoti noteikumi iestādes specifiskiem formātiem apvienojumā ar iebūvētiem noteikumiem standarta formātiem. Šis pāris dod pilnīgu Safe Harbor pārklājumu.

Secinājums

HIPAA de-identifikācija bez pielāgotiem noteikumiem nav Safe Harbor de-identifikācija. Katras slimnīcas MRN formāts ir unikāls. Standarta rīki tos palaiž garām. Atbilstības robs ir reāls un paliek vaļā, līdz jūs to aizverat.

AI paraugu ģenerēšana samazina labojumu no 6–8 nedēļu inženieru darba līdz vienai pēcpusdienai atbilstības darba. Aprakstiet formātu. Pārbaudiet uz reāliem ierakstiem. Izvietojiet. Gatavs.

Avoti

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.