By · Last updated 2026-06-04

Itzuli BlogeraOsasuna

HIPAA MRN Detekzioa Erregex PhD Gabe

Ospitale bakoitzaren MRN formatua desberdina da. Memorial-ek MRN:XXXXXXX erabiltzen du, St. Mary's-ek PT-YYYYY, University Hospital-ek UHN-XXXXXXXXXX.

June 4, 20266 min irakurri
HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

HIPAA MRN Detekzioa Erregex PhD Gabe

Zure ospitalearen MRN formatua ez dago PII tresna estandarretan. Hona nola gehitu bost minututan. Koderik behar ez.

Osasun-informatikako taldeek beste sektoreek ez duten HIPAA arazo bati aurre egin behar diote. Aurkitu behar duten IDa - Erregistro Medikoko Zenbakia - ospitale bakoitzak berak ezarri du. Ez dago estandar nazionalik.

HIPAA de-identifikazio-proiektu bakoitzak konfigurazio pertsonalizatua behar du. Gabe, MRNak "de-identifikatutako" fitxategietatik hautematen gabe irten daitezke.

Instalazio Askotako MRN Arazoa

Fusioen bidez eraikitako ospitale-sareak EHR sistema legazioak dituzte. Sistema bakoitzak bere MRN formatua du:

  • Memorial Hospital (Epic): MRN:XXXXXXX - 7 digituko zenbakia aurrizkiarekin
  • St. Mary's (Cerner): PT-YYYYY - 5 digitu paziente-aurrizkiarekin
  • University Hospital (Meditech): UHN-XXXXXXXXXX - 10 karaktereko nahasketa
  • Klinika (EMR autonomoa): C\d{5} - C letra gehi 5 digitu

HIPAA Safe Harbor-ek 18 ID mota guztiak kentzea eskatzen du. 8. kategoria erregistro medikoko zenbakiak dira. Zure formatua ezagutzen ez duen tresna batek galdutzen ditu. Fitxategia garbi dagoela ematen du. Ez da.

ServiceNow osasun-komunitateak arazo hori zehazki aipatu du. Tresna estandarrek NANak eta telefono-zenbakiak detektatzen dituzte. Instalazioaren MRNak beti galdutzen dituzte.

Erregex-Hesia

Microsoft Presidio-ri arau pertsonalizatuak gehitzea - HIPAA tresna askoren oinarri kode irekia - benetako trebetasuna eskatzen du:

  • PatternRecognizer klasea ezagutu behar duzu
  • Erregex Python sintaxian idatzi behar duzu
  • YAML konfigurazio-fitxategiak konfiguratu behar dituzu
  • Konfiantza-puntuazioak doitu behar dituzu
  • Python scriptak probatu eta arazkatu behar dituzu

MRN formatua ezagutzen duen betetze-arduradunak ezin du hori bakarrik egin. Konponbidea ingeniaritza-txartel gisa amaitzen da. 6-8 astez ilaran egoten da. Hutsuneak zabalik jarraitzen du.

AI-Lagundutako Eredu-Sortzea

Bide azkarrago bat dago. Eredua hitz arruntetan deskribatu. Funtzionatzen duen erregex bat lortu.

Urratsak:

  1. Ireki entitate pertsonalizatuen eraikitzailea
  2. Adibideak eman: "Gure MRNak honela ikusten dira: MRN:1234567, MRN:9876543, MRN:0001234"
  3. AIak araua eraikitzen du: MRN:\d{7}
  4. 10 lagin-erregistroen aurka probatu
  5. MRN guztiak aurkitu al dira? Gorde eta zabaldu.

Lau MRN formatu dituen sare batentzat:

  • Memorial Hospital - MRN:\d{7}
  • St. Mary's - PT-\d{5}
  • University Hospital - UHN-[A-Z0-9]{10}
  • Klinika - C\d{5}

Egin lau entitate pertsonalizatu. Talde batean bildu. Fitxategi guztiekin exekutatu. Denbora: arratsalde bat.

Ikusi MRN detekzio pertsonalizatua HIPAA tuberietatan koderik gabe gida osoa.

Safe Harbor Baliozkotzea

HIPAA Safe Harbor-ek dio estaldurako entitateak ez duela "benetako ezagutza" daturik pertsona bat identifikatu dezakeenik. (45 CFR ss 164.514(b))

Baliozkotzeak zure arau pertsonalizatuek 18 ID mota guztiak estaltzen dituztela erakusten du.

1. urratsa: Laginak atera. 100 erregistro lortu instalazio bakoitzetik. Nahastu denbora-tarteak eta sailak.

2. urratsa: Detekzioa exekutatu. 400 dokumentu guztiak prozesatu zure arau pertsonalizatuekin.

3. urratsa: Giza egiaztapena. Eskuz berrikusi 20 dokumentu (%5 lagina). Begiratu galdutako MRNak eta gezur-alarmak.

4. urratsa: Arauak garbitu. MRNak galdu al dira? Zabaldu eredua. Gezur-alarma gehiegi? Gehitu hitz-mugak.

5. urratsa: Idatzi. Erregistratu araua, lagin-tamaina, emaitzak eta data. Erregistro hori zure Safe Harbor erregistroa da.

Ikusi esplikagarria den berredakzioa eta HIPAA auditoria-ibilbideak zer dokumentatu behar den jakiteko.

Safe Harbor Estaldura Osoa

MRN detekzioa konpondu ondoren, 18 kategoria guztiak egiaztatu.

KategoriaTresna EstandarrakPertsonalizatua Beharrezkoa?
1. IzenakNER ereduaEz
2. Datu geografikoakKokaleku-detekzioaEz estatuarentzat; Bai gune-kodeetarako
3. DatakData-detekzioaEz
4. Telefono-zenbakiakTelefono-detekzioaEz
5. Fax-zenbakiakTelefono-detekzioaEz
6. Posta elektronikoaren helbideakEmail-detekzioaEz
7. NANakNAN-detekzioaEz
8. Erregistro medikoko zenbakiakEz dago integratutaBai - gune-espezifikoa
9. Osasun-planen kide-zenbakiakPartzialaSarritan bai - ordaintzaile-espezifikoa
10. Kontu-zenbakiakPartzialaSarritan bai - fakturazio-formatua
11. Lizentzia-zenbakiakPartzialaSarritan bai - estatu-espezifikoa
12. Ibilgailu-IDakPartzialaArraroa dokumentu klinikoetan
13. Gailu-IDakPartzialaBai gailuak erregistroetan badaude
14. Web URLakURL-detekzioaEz
15. IP helbideakIP-detekzioaEz
16. Identifikatzaile biometrikoakTestu-testuinguruaArraroa alta-oharretan
17. ArgazkiakIrudia soilikTestu-esparrutik kanpo
18. Beste ID bakarrakEz dago integratutaBai - gune-espezifikoa

Testu klinikorako, 8, 9, 10 eta 18 kategoriek sarritan konfigurazio pertsonalizatua behar dute.

Dokumentu Klinikoaren Testuingurua

Alta-oharrak, ohar klinikoak eta eragiketa-txostenak partekatzen diren fitxategi nagusiak dira ikerketarako. Hauek dituzte:

  • MRNak goiburuetan eta oinetan
  • Kontu-zenbakiak fakturazio-ataletan
  • Datak gertakari guztientzat - sarrera, prozedura, laborategia, botika
  • Mediku-izenak eta DEA-zenbakiak
  • Erreferentziazko mediku-informazioa
  • Aseguru-kide-IDak

Gune-espezifikoko formaturako arau pertsonalizatuek formatua estandarrentzako arau integratuekin batera egiten dute. Bikote horrek Safe Harbor estaldura osoa ematen dizu.

Ondorioa

Arau pertsonalizaturik gabeko HIPAA de-identifikazioa ez da Safe Harbor de-identifikazioa. Ospitale bakoitzaren MRN formatua berezia da. Tresna estandarrek galdutzen dituzte. Betetze-hutsunea erreala da eta konpondu arte zabalik jarraitzen du.

AI eredu-sortzeak konponbidea 6-8 asteko ingeniaritza-lanetik arratsalde bateko betetze-lanetara murrizten du. Deskribatu formatua. Probatu benetako erregistroetan. Zabaldu. Amaituta.

Iturriak

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.