18 identifikátorů HIPAA, které váš nástroj přehlíží
Aktualizováno pro rok 2026.
HIPAA uvádí 18 kategorií identifikátorů PHI. Většina nástrojů pro anonymizaci detekuje možná šest. Zbývajících dvanáct proklouzne — a každý z nich představuje mezeru v souladu s předpisy.
Pravidlo Safe Harbor
Pravidlo soukromí HIPAA (45 CFR § 164.514) definuje de-identifikaci metodou Safe Harbor. Musí zmizet všech 18 kategorií identifikátorů. Odstraňte každou z nich a data jsou ze zákona de-identifikována. Proto je Safe Harbor oblíbená: jde o hodnocení splnil/nesplnil, nikoli o úsudek.
18 kategorií je:
- Jména
- Geografické údaje menší než stát — ulice, město, okres, PSČ
- Data s výjimkou roku — narození, přijetí, propuštění, úmrtí
- Telefonní čísla
- Čísla faxů
- E-mailové adresy
- Čísla sociálního zabezpečení
- Identifikátory zdravotní dokumentace (MRN)
- Kódy příjemců zdravotního pojistného plánu
- Čísla účtů
- Čísla certifikátů a licencí
- Identifikátory vozidel a sériová čísla
- Identifikátory zařízení a sériová čísla
- Webové URL adresy
- IP adresy
- Biometrické identifikátory — otisky prstů, hlasové vzory
- Fotografie obličeje a podobné snímky
- Jakýkoli jiný jedinečný identifikační kód nebo hodnota
Většina nástrojů dobře zpracovává kategorie 1, 4, 6 a 7. Kategorie 8, 9, 10, 11, 13 a 18 běžně přehlíží.
Mezera v číslech zdravotní dokumentace (MRN)
Identifikátory zdravotní dokumentace jsou v kategorii 8. Formáty MRN si stanovuje každá nemocnice. Neexistuje žádný celostátní standard USA.
Nemocnice A používá 7místné celé číslo. Nemocnice B používá „PT-RRRRNNNN.” Nemocnice C používá 8místný alfanumerický řetězec. Nemocnice D píše „MRN: ” před 9místný kód.
Generický nástroj „PT-2024-8847” jako PHI neoznačí. Dokument projde kontrolou de-identifikace. Ale de-identifikován není. Žádné upozornění se nespustí. Tým si myslí, že práce je hotová. Není.
To je nejhorší druh mezery: tichá.
Tři způsoby, jak to napravit
Naprogramovat v Presidiu. Vyžaduje znalosti Pythonu a průběžnou údržbu. Funguje, ale zabere čas.
Přidat ruční přezkum. Člověk kontroluje každý dokument na přítomnost MRN. Nelze škálovat.
Použít tvorbu vlastních entit s pomocí AI. Není potřeba kód. Tým poskytne vzorové hodnoty. AI sestaví vzor.
Takto to funguje. Tým zadá pět vzorových hodnot MRN: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. AI vrátí SVHS-\d{7} a ověří ho oproti vzorkům. Tým ho uloží do svého předvolby HIPAA. Všechny budoucí relace tento formát detekují. Stejný postup funguje pro kódy příjemců pojistných plánů a sériová čísla zařízení.
Viz jak předvolby fungují v průvodci detekcí MRN HIPAA. Více o postupu tvorby vzorů pomocí AI.
Skrytý předpoklad
Mnoho týmů testuje na vzorkovém dokumentu se jménem a telefonním číslem. Nástroj projde. Předpokládají úplné pokrytí. Vzorky ale zřídkakdy zahrnují identifikátory specifické pro danou instituci. MRN a kódy příjemců pojistných plánů vypadají pro generický nástroj jako náhodné řetězce. Projdou bez označení.
Skutečný audit Safe Harbor mapuje všech 18 kategorií na metodu detekce. Pro kategorii 8 ověřte skutečnými vzorky MRN z vaší nemocnice. Nepředpokládejte, že nástroj zná váš formát.
Přehled celého rámce viz náš přehled souladu s HIPAA.
Závěr
Safe Harbor vyžaduje odstranění všech 18 kategorií identifikátorů. Generické nástroje pokrývají podstatně méně. Mezery — MRN, kódy příjemců pojistných plánů, sériová čísla zařízení — nemají standardní formát, takže je generické nástroje přehlíží. Vlastní entity vytvořené s pomocí AI mezeru uzavírají bez kódu nebo ručního přezkumu.
Zdroje
- HHS: HIPAA Safe Harbor, 45 CFR § 164.514 — hhs.gov. OVĚŘENO.
- Shaip: Typy identifikátorů PHI v de-identifikaci ve zdravotnictví — shaip.com. OVĚŘENO-EXTERNĚ.
- HHS OCR: Pokyny pro de-identifikaci aktualizované 2024 — hhs.gov. OVĚŘENO.