Atpakaļ uz BloguVeselības Aprūpe

HIPAA MRN noteikšana bez regex ekspertīzes

Katras slimnīcas MRN formāts ir atšķirīgs. Memorial izmanto MRN:XXXXXXX, St. Mary's izmanto PT-YYYYY, University Hospital izmanto UHN-XXXXXXXXXX.

George CurtaJune 4, 20266 min lasīšanai

HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

HIPAA MRN noteikšana bez regex ekspertīzes

Jūsu slimnīcas MRN formāts nav nevienā standarta PII rīkā. Lūk, kā to pievienot piecās minūtēs. Bez koda.

Veselības aprūpes IT komandas saskaras ar HIPAA problēmu, kas nav citām nozarēm. ID, ko viņi visvairāk vajag atrast — medicīnas kartītes numurs — ir noteikts pašas slimnīcas. Valsts standarts nepastāv.

Katram HIPAA de-identifikācijas projektam nepieciešama pielāgota iestatīšana. Bez tās MRN izslīd cauri "de-identificētajiem" failiem nepamanīti.

Daudzas iestādes — dažādi MRN formāti

Slimnīcu tīkli, kas veidoti caur apvienošanos, izmanto mantotās EHR sistēmas. Katrai sistēmai ir savs MRN formāts:

Memorial Hospital (Epic): MRN:XXXXXXX — 7 ciparu numurs ar prefiksu
St. Mary's (Cerner): PT-YYYYY — 5 cipari ar pacienta prefiksu
University Hospital (Meditech): UHN-XXXXXXXXXX — 10 rakstzīmju kombinācija
Klīnika (atsevišķa EMR): C\d{5} — burts C plus 5 cipari

HIPAA Safe Harbor prasa noņemt visus 18 ID tipus. 8. kategorija ir medicīnas kartītes numuri. Rīks, kas nezina jūsu formātu, tos palaidīs garām. Fails izskatās tīrs. Tas nav.

ServiceNow veselības aprūpes kopiena ir atzīmējusi šo precīzo problēmu. Standarta rīki nosaka sociālās apdrošināšanas numurus un tālruņa numurus. Tie vienmēr palaiž garām iestādes MRN.

Regex barjera

Pielāgotu noteikumu pievienošana Microsoft Presidio — daudziem HIPAA rīkiem atvērtā koda pamatam — prasa reālas prasmes:

Jums jāzina PatternRecognizer klase
Jums jāraksta regex Python sintaksē
Jums jāiestata YAML konfigurācijas faili
Jums jāpielāgo ticamības vērtējumi
Jums jātestē un jāatkļūdo Python skripti

Atbilstības speciālists, kas zina MRN formātu, to nevar izdarīt viens. Labojums nonāk kā inženieru uzdevums. Tas gaida rindā 6–8 nedēļas. Robs paliek vaļā.

AI palīdzēta paraugu ģenerēšana

Ir ātrāks veids. Aprakstiet paraugu vienkāršos vārdos. Saņemiet darbojošos regex atpakaļ.

Soļi:

Atveriet pielāgotās entītijas veidotāju
Sniedziet piemērus: "Mūsu MRN izskatās šādi: MRN:1234567, MRN:9876543, MRN:0001234"
AI izveido noteikumu: MRN:\d{7}
Pārbaudiet ar 10 parauga ierakstiem
Visi MRN atrasti? Saglabājiet un izvietojiet.

Tīklam ar četriem MRN formātiem:

Memorial Hospital → MRN:\d{7}
St. Mary's → PT-\d{5}
University Hospital → UHN-[A-Z0-9]{10}
Klīnika → C\d{5}

Izveido četras pielāgotas entītijas. Grupējiet tās iepriekšiestatījumā. Palaidiet uz visiem failiem. Laiks: viena pēcpusdiena.

Skatiet pielāgota MRN noteikšana HIPAA konveieros bez koda pilnai pamācības rokasgrāmatai.

Validācija Safe Harbor ievērošanai

HIPAA Safe Harbor nosaka, ka pārklātajai entītijai nedrīkst būt faktiskas zināšanas, ka dati varētu identificēt kādu personu. (45 CFR §164.514(b))

Validācija parāda, ka jūsu pielāgotie noteikumi sedz visus 18 ID tipus.

1. solis: Iegūstiet paraugus. Iegūstiet 100 ierakstus no katras iestādes. Sajauciet laika periodus un nodaļas.

2. solis: Palaidiet noteikšanu. Apstrādājiet visus 400 dokumentus ar saviem pielāgotajiem noteikumiem.

3. solis: Cilvēka pārbaude. Pārskatiet 20 dokumentus ar roku (5% paraugs). Meklējiet nokavētus MRN un nepatiesus rezultātus.

4. solis: Uzlabojiet noteikumus. Nokavēti MRN? Paplašiniet paraugu. Pārāk daudz nepatiesu rezultātu? Pievienojiet vārdu robežas.

5. solis: Pierakstiet to. Reģistrējiet noteikumu, parauga lielumu, rezultātus un datumu. Šis žurnāls ir jūsu Safe Harbor ieraksts.

Skatiet izskaidrojama anonimizācija un HIPAA revīzijas pēdas par papildu informāciju, kas jādokumentē.

Pilnīgs Safe Harbor pārklājums

Pēc MRN noteikšanas labošanas pārbaudiet visas 18 kategorijas.

Kategorija	Standarta rīki	Pielāgots nepieciešams?
1. Vārdi	NER modelis	Nē
2. Ģeogrāfiskie dati	Atrašanās vietas noteikšana	Nē štata līmenim; Jā iestādes kodiem
3. Datumi	Datuma noteikšana	Nē
4. Tālruņa numuri	Tālruņa noteikšana	Nē
5. Faksa numuri	Tālruņa noteikšana	Nē
6. E-pasta adreses	E-pasta noteikšana	Nē
7. Sociālās apdrošināšanas numuri	SSN noteikšana	Nē
8. Medicīnas kartītes numuri	Nav iebūvēts	Jā — iestādes specifisks
9. Veselības plāna biedru numuri	Daļējs	Bieži jā — maksātāja specifisks
10. Konta numuri	Daļējs	Bieži jā — norēķinu formāts
11. Licences numuri	Daļējs	Bieži jā — štata specifisks
12. Transportlīdzekļu ID	Daļējs	Reti klīniskajos dokumentos
13. Ierīces ID	Daļējs	Jā, ja ierīces ir ierakstos
14. Tīmekļa URL	URL noteikšana	Nē
15. IP adreses	IP noteikšana	Nē
16. Biometriskie ID	Teksta konteksts	Reti izrakstu piezīmēs
17. Fotogrāfijas	Tikai attēls	Ārpus teksta apjoma
18. Citi unikālie ID	Nav iebūvēts	Jā — iestādes specifisks

Klīniskajam tekstam kategorijas 8, 9, 10 un 18 visbiežāk prasa pielāgotu iestatīšanu.

Klīnisko dokumentu konteksts

Izrakstu piezīmes, klīniskās piezīmes un operāciju pārskati ir galvenie faili, kas tiek kopīgoti pētniecībai. Tajos ir:

MRN galvenēs un kājenēs
Konta numuri norēķinu sadaļās
Datumi visiem notikumiem — uzņemšana, procedūra, laboratorija, zāles
Ārstu vārdi un DEA numuri
Nosūtošā ārsta informācija
Apdrošināšanas biedru ID

Pielāgoti noteikumi iestādes specifiskiem formātiem apvienojumā ar iebūvētiem noteikumiem standarta formātiem. Šis pāris dod pilnīgu Safe Harbor pārklājumu.

Secinājums

HIPAA de-identifikācija bez pielāgotiem noteikumiem nav Safe Harbor de-identifikācija. Katras slimnīcas MRN formāts ir unikāls. Standarta rīki tos palaiž garām. Atbilstības robs ir reāls un paliek vaļā, līdz jūs to aizverat.

AI paraugu ģenerēšana samazina labojumu no 6–8 nedēļu inženieru darba līdz vienai pēcpusdienai atbilstības darba. Aprakstiet formātu. Pārbaudiet uz reāliem ierakstiem. Izvietojiet. Gatavs.

Avoti

Saistītie Raksti

Veselības Aprūpe

HIPAA: Hospital-Specific MRN Detection

HIPAA Safe Harbor requires removing medical record numbers — but MRN formats are not standardized. Epic, Cerner, and Meditech all use different formats.

Veselības Aprūpe

HIPAA Safe Harbor De-ID at Scale

HIPAA Safe Harbor requires removing 18 specific PHI identifier categories. Academic medical centers need de-identification at scale but existing tools.

Veselības Aprūpe

ISO 27001 & HIPAA BAAs for Healthcare

HIPAA Business Associate Agreements require 'satisfactory assurances' of appropriate safeguards. ISO 27001 maps directly to HIPAA 164.

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

Sākt Bezmaksas Izmēģinājumu Skatīt Funkcijas

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

We follow these rules

GDPR (EU 2016/679).
ISO/IEC 27001:2022.
NIS2 (EU 2022/2555).
HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our company HQ is in Saarbrücken, Germany. Our servers run in Hetzner's Falkenstein datacenter.

Hetzner holds ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

We never sell your information to third parties.
We never train models on what you upload.
We never keep your work after you delete it.
We never share keys with any outside firm.
We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.