Aktualizováno pro rok 2026
HIPAA Safe Harbor de-identifikace: Detekce formátů MRN specifických pro nemocnici bez programování
HIPAA Safe Harbor vyžaduje odstranění čísel zdravotních záznamů. Jedná se o jeden z 18 požadovaných typů ID. Zní to jednoduše. Problém je v tom, že formáty MRN nejsou standardizované.
Epic používá jeden formát. Cerner používá jiný. Meditech používá další. Každá nemocnice přidává vlastní kódy. Regionální zdravotnické skupiny vytvářejí ještě více formátů. Standardní nástroj PII nemůže znát váš formát. Vaše čísla MRN přehlédne.
To není zanedbatelné riziko. Zdravotnické IT týmy často nacházejí MRN stále v datasetech, které měly být de-identifikovány. Nástroj byl nastaven pouze pro běžné typy PII.
Problém s formátem MRN
USA nemá žádný národní standard pro čísla zdravotních záznamů. Každá nemocnice nebo dodavatel EHR definuje vlastní formát.
Běžně pozorované vzory:
- Styl Epic: 8–12 číslic (např. 123456789)
- Styl Cerner: Předpona kódu nemocnice + číselná část (např. MGH-987654)
- Regionální sítě: Kód zařízení + rok + sekvence (např. HOSP-2023-456789)
- Veterans Affairs: 9 číslic s kontrolní číslicí
- Pediatrické systémy: Předpona typu pacienta + číselná část (např. PED-12345678)
Žádné jediné pravidlo nepokryje všechny tyto formáty. Neexistuje žádný universální vzor MRN.
Co standardní nástroje PII zachytí: Většina nástrojů HIPAA se zaměřuje na ID s pevným formátem. SSN sleduje formát XXX-XX-XXXX. Telefonní čísla sledují formát XXX-XXX-XXXX. E-mailové adresy mají jasný tvar. Ty jsou snadno nalezitelné.
MRN, čísla účtů a čísla licencí jsou typy HIPAA 8, 10 a 11. Ty se liší nemocnici od nemocnice. Potřebují vlastní nastavení. Obecný nástroj je nezachytí.
Mezera v compliance
Regionální nemocnice chce sdílet pacientská data s univerzitním výzkumným partnerem. Jejich EHR používá tento formát MRN: HOSP-RRRR-XXXXXX.
Data spustí přes svůj nástroj HIPAA. Nástroj odstraní jména, data, telefonní čísla a SSN. MRN neodstraní. HOSP-2023-456789 neodpovídá žádnému vestavěnému pravidlu.
Výzkumník dataset obdrží. Spojí ho se svými záznamy. Tyto záznamy zahrnují MRN z dřívějších doporučení ve stejné nemocnici. Mnoho pacientů může být nyní znovu identifikováno. Nemocnice má porušení HIPAA.
To je skutečný způsob selhání. Viz také de-identifikace HIPAA Safe Harbor pro zdravotnický výzkum pro více informací o tom, kde Safe Harbor selhává.
Řešení: Vytvoření vlastní entity
Řešením je definovat formát vašeho MRN jako vlastní entitu. Compliance officer to může provést. Inženýr není potřeba.
Kroky:
-
Zapište formát: „Začíná HOSP, pak pomlčka, čtyřciferný rok, pomlčka a šesticiferné číslo”
-
Použijte AI nástroj pro vytvoření regulárního výrazu: HOSP-\\d{4}-\\d{6}
-
Otestujte na 20 propouštěcích zprávách. Potvrďte, že zachytí všechna MRN.
-
Uložte jako vlastní entitu nazvanou „Nemocniční MRN”
-
Přidejte ji do vašeho HIPAA presetu vedle standardních 17 typů ID
Tento proces zabere compliance officerovi přibližně 3 dny. Budování vlastního kódu může trvat 3 měsíce.
Příklad: Síť 15 zdravotnických zařízení
Organizace: Regionální nemocniční síť 15 zařízení
Formát MRN: HOSP-RRRR-XXXXXX (v tisících propouštěcích zpráv PDF)
Cíl: Sdílet výzkumný dataset s univerzitním partnerem podle dohody o využití dat HIPAA
Starý přístup: Externím dodavatelem de-identifikace za 120 000 USD ročně
Nalezená mezera: Nástroj dodavatele nedetekoval formát MRN specifický pro instituci
Nový pracovní postup:
- Compliance officer definuje vzor MRN — 20 minut
- AI ověří regulární výraz — 5 minut
- Testování na 50 vzorových zprávách — 30 minut
- Potvrzení, že nezůstala žádná MRN, žádné falešné pozitivy — 10 minut
- Přidání vlastní entity do HIPAA presetu
- Spuštění celého datasetu 50 000 záznamů v dávkovém режиму
Celkový čas k uzavření mezery: jedno odpoledne.
Sítě více zařízení: Více formátů MRN
Nemocniční sítě budované prostřednictvím fúzí často provozují několik EHR systémů. Každý starší systém může používat jiný formát MRN.
Jak to řešit:
Vytvořte samostatnou vlastní entitu pro každý formát:
- „Formát MRN A (Epic)” — 8-ciferný číselný
- „Formát MRN B (starší Cerner)” — předpona + 7-ciferný číselný
- „Formát MRN C (přidružená afilace)” — kód státu + rok + sekvence
Jeden preset obsahuje všechny tři vlastní entity plus standardní typy ID HIPAA. Každý dokument z každého zařízení bude mít svá MRN odstraněna.
Viz vlastní detekce MRN v pipeline HIPAA bez kódu pro podrobného průvodce tímto nastavením s více formáty.
Mimo MRN: Další nestandardní identifikátory
Stejný přístup funguje i pro další typy ID HIPAA Safe Harbor.
Čísla členů zdravotního plánu (kategorie 9): Každá pojišťovna používá vlastní formát. Aetna, Blue Cross a United Healthcare vypadají všechny jinak. Fakturační tým potřebuje vlastní vzor pro každého plátce.
Čísla účtů (kategorie 10): Čísla fakturačních účtů nemocnic se liší nemocnici od nemocnice.
Čísla licencí (kategorie 11): DEA čísla mají standardní federální formát. Čísla státních lékařských licencí nikoli. Každá státní rada používá vlastní formát.
Identifikátory zařízení (kategorie 14): Sériová čísla zdravotnických pomůcek jsou stanovena každým výrobcem.
Pro každý z těchto typů vlastní entita uzavírá mezeru. Inženýři nejsou potřeba.
Viz vlastní identifikátory PII pro organizační anonymizaci pro více informací o nestandardních typech ID.
Validace: Prokázání souladu se Safe Harbor
HIPAA Safe Harbor říká, že krytý subjekt nesmí mít „skutečnou znalost”, že by data mohla identifikovat osobu. (45 CFR §164.514(b)(1))
Validace vlastní entity dokazuje pokrytí všech 18 typů ID.
Kroky validace:
- Zpracujte 50–100 vzorových dokumentů z výzkumného datasetu
- Přezkumejte výstup — vypadá něco jako ID?
- Spusťte druhý detekční průchod pro zachycení případných přehlédnutých položek
- Zdokumentujte, co jste provedli
Vaše nastavení vlastní entity, přezkoumání vzorků a protokoly zpracování tvoří váš záznam Safe Harbor.
Závěr
Standardní nástroje PII s výchozím nastavením nedokončí de-identifikaci HIPAA Safe Harbor. Čísla zdravotních záznamů jsou specifická pro každou nemocnici. Potřebují vlastní detekci.
Vytvoření vlastní entity tuto mezeru uzavírá během hodin. Compliance officers mohou definovat vzor, otestovat ho a zpracovat data. Žádná inženýrská práce není potřeba.
Mezera mezi „spustili jsme nástroj HIPAA” a „odstranili jsme všech 18 identifikátorů Safe Harbor” je často jen jedna chybějící vlastní entita.