anonym.legal

By · Last updated 2026-06-04

Înapoi la BlogSănătate

Detectarea MRN conform HIPAA fără doctorat în regex

Formatul MRN al fiecărui spital este diferit. Memorial folosește MRN:XXXXXXX, St. Mary's folosește PT-YYYYY, University Hospital folosește UHN-XXXXXXXXXX.

June 4, 20266 min citire
HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

Detectarea MRN conform HIPAA fără doctorat în regex

Formatul MRN al spitalului tău nu se găsește în niciun instrument PII standard. Iată cum să îl adaugi în cinci minute. Nu este nevoie de cod.

Echipele IT din domeniul sănătății se confruntă cu o problemă HIPAA pe care alte sectoare nu o au. ID-ul pe care trebuie cel mai mult să îl găsească — Numărul de înregistrare medicală — este stabilit de propriul spital. Nu există niciun standard național.

Orice proiect de de-identificare HIPAA necesită configurare personalizată. Fără aceasta, MRN-urile trec nedetectate prin fișierele „de-identificate".

Problema MRN-urilor multi-facilitate

Rețelele spitalicești construite prin fuziuni au sisteme EHR moștenite. Fiecare sistem are propriul format MRN:

  • Memorial Hospital (Epic): MRN:XXXXXXX — număr cu 7 cifre cu prefix
  • St. Mary's (Cerner): PT-YYYYY — 5 cifre cu prefix pacient
  • University Hospital (Meditech): UHN-XXXXXXXXXX — combinație de 10 caractere
  • Clinică (EMR independent): C\d{5} — litera C plus 5 cifre

Safe Harbor HIPAA impune eliminarea tuturor celor 18 tipuri de ID. Categoria 8 cuprinde numerele de înregistrare medicală. Un instrument care nu cunoaște formatul tău le va rata. Fișierul pare curat. Nu este.

Comunitatea ServiceNow pentru sănătate a remarcat exact această problemă. Instrumentele standard detectează CNP-urile și numerele de telefon. Ratează MRN-urile specifice facilității de fiecare dată.

Bariera regex

Adăugarea de reguli personalizate în Microsoft Presidio — baza open-source pentru multe instrumente HIPAA — necesită abilități reale:

  • Trebuie să cunoști clasa PatternRecognizer
  • Trebuie să scrii regex în sintaxa Python
  • Trebuie să configurezi fișiere YAML
  • Trebuie să ajustezi scorurile de încredere
  • Trebuie să testezi și să depanezi scripturi Python

Un ofițer de conformitate care cunoaște formatul MRN nu poate face asta singur. Remedierea ajunge ca tichet de inginerie. Stă în coadă 6–8 săptămâni. Breșa rămâne deschisă.

Generarea de tipare asistată de IA

Există o cale mai rapidă. Descrie tiparul în cuvinte simple. Obții înapoi un regex funcțional.

Pași:

  1. Deschide constructorul de entități personalizate
  2. Oferă exemple: „MRN-urile noastre arată astfel: MRN:1234567, MRN:9876543, MRN:0001234"
  3. IA construiește regula: MRN:\d{7}
  4. Testează pe 10 înregistrări eșantion
  5. Toate MRN-urile găsite? Salvează și implementează.

Pentru o rețea cu patru formate MRN:

  • Memorial Hospital → MRN:\d{7}
  • St. Mary's → PT-\d{5}
  • University Hospital → UHN-[A-Z0-9]{10}
  • Clinică → C\d{5}

Creează patru entități personalizate. Grupează-le într-o presetare. Rulează pe toate fișierele. Timp necesar: o după-amiază.

Consultați detectarea personalizată a MRN în pipeline-urile HIPAA fără cod pentru un ghid complet.

Validarea pentru Safe Harbor

Safe Harbor HIPAA prevede că entitatea acoperită nu trebuie să aibă „cunoștință efectivă" că datele ar putea identifica o persoană. (45 CFR §164.514(b))

Validarea demonstrează că regulile tale personalizate acoperă toate cele 18 tipuri de ID.

Pasul 1: Extrage eșantioane. Obține 100 de înregistrări de la fiecare locație. Amestecă perioadele de timp și departamentele.

Pasul 2: Rulează detectarea. Procesează toate cele 400 de documente cu regulile tale personalizate.

Pasul 3: Verificare umană. Revizuiește 20 de documente manual (eșantion de 5%). Caută MRN-uri ratate și rezultate fals pozitive.

Pasul 4: Rafinează regulile. MRN-uri ratate? Lărgește tiparul. Prea multe rezultate fals pozitive? Adaugă limite de cuvânt.

Pasul 5: Documentează. Înregistrează regula, dimensiunea eșantionului, rezultatele și data. Acest jurnal este înregistrarea ta Safe Harbor.

Consultați redactarea explicabilă și trasabilitatea auditului HIPAA pentru mai multe informații despre ce trebuie documentat.

Acoperire completă Safe Harbor

După remedierea detectării MRN, verifică toate cele 18 categorii.

CategorieInstrumente standardNevoie personalizare?
1. NumeModel NERNu
2. Date geograficeDetectare locațiiNu pentru stat; Da pentru coduri de locație
3. DateDetectare dateNu
4. Numere de telefonDetectare telefonNu
5. Numere de faxDetectare telefonNu
6. Adrese de emailDetectare emailNu
7. CNP-uriDetectare CNPNu
8. Numere de înregistrare medicalăNu sunt incluseDa — specifice locației
9. Numere de membru plan de sănătateParțialAdesea da — specifice asigurătorului
10. Numere de contParțialAdesea da — format de facturare
11. Numere de licențăParțialAdesea da — specifice statului
12. ID-uri vehiculeParțialRar în documente clinice
13. ID-uri dispozitiveParțialDa dacă dispozitivele sunt în înregistrări
14. URL-uri webDetectare URLNu
15. Adrese IPDetectare IPNu
16. ID-uri biometriceContext textRar în notițe de externare
17. FotografiiDoar imaginiÎn afara scopului pentru text
18. Alți ID-uri uniciNu sunt incluseDa — specifice locației

Pentru textele clinice, categoriile 8, 9, 10 și 18 necesită cel mai frecvent configurare personalizată.

Contextul documentelor clinice

Notele de externare, notele clinice și rapoartele operatorii sunt principalele fișiere partajate pentru cercetare. Acestea conțin:

  • MRN-uri în antete și subsoluri
  • Numere de cont în secțiunile de facturare
  • Date pentru toate evenimentele — internare, procedură, laborator, medicament
  • Numele medicilor și numerele DEA
  • Informații despre medicul de referință
  • ID-urile de membru ale asigurărilor

Regulile personalizate pentru formatele specifice locației se combină cu regulile încorporate pentru formatele standard. Această combinație oferă acoperire completă Safe Harbor.

Concluzie

De-identificarea HIPAA fără reguli personalizate nu este de-identificare Safe Harbor. Formatul MRN al fiecărui spital este unic. Instrumentele standard le ratează. Breșa de conformitate este reală și rămâne deschisă până o închizi.

Generarea de tipare asistată de IA reduce remedierea de la 6–8 săptămâni de inginerie la o după-amiază de muncă de conformitate. Descrie formatul. Testează-l pe înregistrări reale. Implementează-l. Gata.

Surse

Pregătit să vă protejați datele?

Începeți să anonimizati PII cu 285+ tipuri de entități în 48 de limbi.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.