Problém standardizace MRN
Na rozdíl od SSN (###-##-####), která mají standardní formát vymáhaný vládou, Medical Record Numbers (MRN) jsou přiřazovány jednotlivými zdravotnickými zařízeními — každé zařízení volí vlastní formát bez vnějšího standardu.
Výsledek: jakýkoliv software pro HIPAA de-identifikaci pracující na datech z více zařízení musí zpracovávat heterogenní vzory MRN.
Dokumentování vzorů MRN vašeho zařízení
Před konfigurací detekce, zdokumentujte MRN formáty vašeho zařízení:
Krok 1: Získejte vzorové MRN Pracujte s vaším IT oddělením nebo správcem EHR, abyste získali 20-30 vzorových MRN z vašeho systému (deidentifikujte vzorky ověřením, že nejsou aktivní záznamy pacientů).
Krok 2: Identifikujte strukturu formátu Ze vzorků identifikujte:
- Celkovou délku
- Alfanumerické vs. čistě numerické
- Prefix/suffix vzory
- Oddělovací znaky (pomlčky, lomítka, mezery)
- Korelace s rokem přijmu nebo jiné zakódované informace
Krok 3: Ověřte variace Ověřte, zda existuje více formátů (historické záznamy mohou mít odlišné formáty od moderních přírůstků).
Správa více formátů zařízení
Výzkumný projekt spojující záznamy z pěti nemocničních systémů potřebuje podporovat pět sad vzorů MRN. Implementujte composite rekognizér, který zahrnuje vzory pro každé zařízení:
multi_facility_patterns = [
Pattern(name="facility_a", regex=r"MRN:\s*[0-9]{7}", score=0.9),
Pattern(name="facility_b", regex=r"PT-[0-9]{5}", score=0.9),
Pattern(name="facility_c", regex=r"UH-[0-9]{4}-[0-9]{5}", score=0.85),
]
Zdroje: