By · Last updated 2026-06-04

Atgal į BlogąSveikatos Priežiūra

HIPAA MRN aptikimas be regex doktorantūros

Kiekvienos ligoninės MRN formatas yra skirtingas. Memorial naudoja MRN:XXXXXXX, St. Mary's - PT-YYYYY, University Hospital - UHN-XXXXXXXXXX.

June 4, 20266 min skaityti
HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

HIPAA MRN aptikimas be regex doktorantūros

Jūsų ligoninės MRN formatas nėra jokiame standartiniame AAS įrankyje. Štai kaip jį pridėti per penkias minutes. Kodo nereikia.

Sveikatos priežiūros IT komandos susiduria su HIPAA problema, kurios kitų sektorių nėra. Identifikatorius, kurį jos labiausiai reikia rasti - medicinos įrašo numeris - nustatomas pačios ligoninės. Jokio nacionalinio standarto nėra.

Kiekvienas HIPAA depersonalizavimo projektas reikalauja specialios konfigūracijos. Be jos MRN praslysta per "depersonalizuotus" failus neaptikti.

Kelių įstaigų MRN problema

Ligoninių tinklai, sukurti per susijungimus, turi palikimo EHR sistemas. Kiekviena sistema turi savo MRN formatą:

  • Memorial Hospital (Epic): MRN:XXXXXXX - 7 skaitmenų numeris su priešdėliu
  • St. Mary's (Cerner): PT-YYYYY - 5 skaitmenys su paciento priešdėliu
  • University Hospital (Meditech): UHN-XXXXXXXXXX - 10 simbolių mišinys
  • Klinika (atskira EMR): C\d{5} - raidė C ir 5 skaitmenys

HIPAA saugaus prieglobsčio taisyklė reikalauja pašalinti visus 18 identifikatorių tipų. 8 kategorija yra medicinos įrašų numeriai. Įrankis, kuris nežino jūsų formato, juos praleis. Failas atrodo švaras. Jis nėra.

ServiceNow sveikatos priežiūros bendruomenė pastebėjo šią tikslią problemą. Standartiniai įrankiai aptinka socialinio draudimo ir telefono numerius. Jie praleidžia įstaigų MRN kiekvieną kartą.

Regex kliūtis

Specialių taisyklių pridėjimas prie Microsoft Presidio - atvirojo kodo pagrindo daugeliui HIPAA įrankių - reikalauja realių įgūdžių:

  • Reikia žinoti PatternRecognizer klasę
  • Reikia rašyti regex Python sintakse
  • Reikia nustatyti YAML konfigūracijos failus
  • Reikia derinti pasitikėjimo balus
  • Reikia testuoti ir derinti Python scenarijus

Atitikties pareigūnas, kuris žino MRN formatą, to negali padaryti vienas. Pataisymas pasibaigia kaip inžinerijos bilietas. Jis laukia eilėje 6-8 savaites. Spraga lieka atvira.

DI padedamas šablono generavimas

Yra greitesnis būdas. Apibūdinkite šabloną paprasta kalba. Gaukite veikiantį regex atgal.

Žingsniai:

  1. Atidarykite specialių objektų kūriklį
  2. Pateikite pavyzdžius: "Mūsų MRN atrodo taip: MRN:1234567, MRN:9876543, MRN:0001234"
  3. DI sukuria taisyklę: MRN:\d{7}
  4. Patikrinkite su 10 pavyzdinių įrašų
  5. Visi MRN rasti? Išsaugokite ir diekite.

Tinklui su keturiais MRN formatais:

  • Memorial Hospital → MRN:\d{7}
  • St. Mary's → PT-\d{5}
  • University Hospital → UHN-[A-Z0-9]{10}
  • Klinika → C\d{5}

Sukurkite keturis specialius objektus. Sugrupuokite juos į išankstinę konfigūraciją. Paleiskite visuose failuose. Laikas: viena popietė.

Žr. specialus MRN aptikimas HIPAA grandinėse be kodo dėl viso vadovo.

Tikrinimas dėl saugaus prieglobsčio

HIPAA saugaus prieglobsčio taisyklė sako, kad apdraustas subjektas neturi turėti "faktinių žinių", kad duomenys galėtų identifikuoti asmenį. (45 CFR §164.514(b))

Patikrinimas parodo, kad jūsų specialios taisyklės apima visus 18 identifikatorių tipų.

1 žingsnis: Paimkite pavyzdžius. Gaukite 100 įrašų iš kiekvienos svetainės. Maišykite laikotarpius ir skyrius.

2 žingsnis: Paleiskite aptikimą. Apdorokite visus 400 dokumentų su savo specialiomis taisyklėmis.

3 žingsnis: Žmogaus patikrinimas. Peržiūrėkite 20 dokumentų rankiniu būdu (5% imtis). Ieškokite praleistų MRN ir klaidingų atsakymų.

4 žingsnis: Tobulinkite taisykles. Praleisti MRN? Plėskite šabloną. Per daug klaidingų atsakymų? Pridėkite žodžių ribas.

5 žingsnis: Užrašykite. Registruokite taisyklę, imties dydį, rezultatus ir datą. Šis žurnalas yra jūsų saugaus prieglobsčio įrašas.

Žr. paaiškinamas redagavimas ir HIPAA audito sekos dėl daugiau informacijos apie dokumentavimą.

Visiškas saugaus prieglobsčio aprėptis

Pataisius MRN aptikimą, patikrinkite visas 18 kategorijų.

KategorijaStandartiniai įrankiaiReikia specialaus?
1. VardaiNER modelisNe
2. Geografiniai duomenysVietos aptikimasNe valstijoms; Taip svetainės kodams
3. DatosDatų aptikimasNe
4. Telefono numeriaiTelefono aptikimasNe
5. Fakso numeriaiTelefono aptikimasNe
6. El. pašto adresaiEl. pašto aptikimasNe
7. Socialinio draudimo numeriaiAptikimasNe
8. Medicinos įrašų numeriaiNeįdiegtaTaip - specifinis svetainei
9. Sveikatos plano narių numeriaiDalinisDažnai taip - specifinis mokėtojui
10. Sąskaitų numeriaiDalinisDažnai taip - sąskaitų formatas
11. Licencijų numeriaiDalinisDažnai taip - specifinis valstijai
12. Transporto priemonių identifikatoriaiDalinisRetai klinikiniuose dokumentuose
13. Prietaisų identifikatoriaiDalinisTaip, jei prietaisai yra įrašuose
14. Žiniatinklio URLURL aptikimasNe
15. IP adresaiIP aptikimasNe
16. Biometriniai identifikatoriaiTeksto kontekstasRetai išrašų pastabose
17. NuotraukosTik vaizdasUž teksto apimties
18. Kiti unikalūs identifikatoriaiNeįdiegtaTaip - specifinis svetainei

Klinikiniame tekste kategorijoms 8, 9, 10 ir 18 dažniausiai reikia specialios konfigūracijos.

Klinikinio dokumento kontekstas

Išrašų pastabos, klinikinės pastabos ir operacijos ataskaitos yra pagrindiniai failai, dalijami tyrimams. Jie turi:

  • MRN antraštėse ir poraštėse
  • Sąskaitų numerius atsiskaitymo skyriuose
  • Visų įvykių datas - priėmimo, procedūros, laboratorijos, vaistų
  • Gydytojų vardus ir DEA numerius
  • Siunčiančio gydytojo informaciją
  • Draudimo narių identifikatorius

Specialios taisyklės svetainės specifiniams formatams suporuotos su įdiegtomis taisyklėmis standartiniams formatams. Ši pora suteikia visišką saugaus prieglobsčio aprėptį.

Išvada

HIPAA depersonalizavimas be specialių taisyklių nėra saugaus prieglobsčio depersonalizavimas. Kiekvienos ligoninės MRN formatas yra unikalus. Standartiniai įrankiai juos praleidžia. Atitikties spraga yra reali ir lieka atvira, kol jos neuždarysite.

DI šablono generavimas sumažina pataisymą nuo 6-8 savaičių inžinerinio darbo iki vienos atitikties darbo popietės. Apibūdinkite formatą. Patikrinkite su realiais įrašais. Diekite. Atlikta.

Šaltiniai

Pasiruošę apsaugoti savo duomenis?

Pradėkite anonimizuoti PII su 285+ subjektų tipais 48 kalbomis.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.