HIPAA 18 PHI Identifikátorov
HIPAA definuje 18 kategórií chránených zdravotných informácií, ktoré sa musí anonymizovať:
- Meno pacienta — Všetky mená a zmeny mena
- Geografické polohy — Mestá, mestá, okresy, štáty, ZIP kódy, krajiny
- Dátumy — Všetky dátumy (narodenie, prijatia, vypisovania) — s výnimkou roku, ak je > 90 rokov
- Telefónne čísla — Všetky telefonné čísla
- E-mailové adresy — Všetky e-mailové adresy
- Sociálne bezpečnostné čísla (SSN) — XXX-XX-XXXX
- Čísla medicínskych záznamov — Všetky čísla pacientov, čísla návštev
- Čísla zdravotného poistenia — Všetky čísla poistenia
- Čísla podlož na zdravú starostlivosť — Čísla podľa schém (Medicare, Medicaid, atď.)
- Čísla účtov — Všetky finanční čísla účtov
- Podľa VIN (Vehicle Identification Number) — Čísla vozidiel
- Podľa Sériové čísla zariadení — Počítačové čísla, sériové čísla prístrojov
- Akékoľvek iné jedinečné identifikačné číslo — Ako ID autora, študent čísla, zamestnaní čísla
- Fotografické prvky — Masky tváre, fotografie
- Webové adresy (URLs) — Všetky webové adresy okrem domény
- IP adresy — Všetky IP adresy
- Identifikátory biometrických údajov — Otisková prsta, retina, čeľusť
- Akákoľvek iná identifikácia čísla — Akákoľvek kombinácii textu a čísiel, ktorá identifikuje jednotlivca
Príklady
Príklad 1: Jednoduché medicínske záznamy
Medicínsky záznam:
- Pacient: John Smith (ID #1: Meno)
- Narodený: 01/01/1980 (ID #3: Dátum)
- Adresa: 123 Main St, New York, NY 10001 (ID #2: Geografická poloha)
- Telefón: (555) 123-4567 (ID #4: Telefón)
- Diagnóza: Diabetu typu 2
HIPAA anonymizácia:
- Pacient: [PATIENT_NAME]
- Narodený: [DATE_OF_BIRTH]
- Adresa: [LOCATION]
- Telefón: [PHONE]
- Diagnóza: Diabetu typu 2 (OK — nie je PII)
Príklad 2: Komplexné zdravotnícke dokumenty
Hospitalizáciou záznam:
- Pacient: Jane Doe
- Zdravotn. číslo: #987654321
- Zdravotňa poisť. číslo: ABC123456789
- Dátum prijatia: 2024-05-15
- Hlavný problém: Rozsiahla zlomenina
- Chirurg: Dr. Robert Johnson
- Zbor: Room 204, Floor 3, Building B, Nemocnica XYZ, Boston, MA
- Tele. číslo núdzové: (617) 555-1234
- E-mail: jane@example.com
- Sociálne číslo: 123-45-6789
- Diagnóza: ICD-10 S52.531A (Zlomenina polomerného kosti, pravá ruka)
- Lieková: Morfín 10mg IV
HIPAA anonymizácia:
- Pacient: [PATIENT_NAME]
- Zdravotn. číslo: [MEDICAL_RECORD_NUMBER]
- Zdravotňa poisť. číslo: [INSURANCE_NUMBER]
- Dátum prijatia: [DATE_OF_ADMISSION]
- Hlavný problém: Rozsiahla zlomenina (OK — symptóm)
- Chirurg: [PROVIDER_NAME]
- Zbor: [LOCATION]
- Tele. číslo núdzové: [PHONE]
- E-mail: [EMAIL]
- Sociálne číslo: [SSN]
- Diagnóza: ICD-10 S52.531A (OK — medicínska klasifikácia)
- Lieková: Morfín 10mg IV (OK — lieková, nie identifikátor)
Príklad 3: Klinická výskumn. poznámka
Poznámka:
Pacient: 45-letý muž z New York (meno nie je spomenuté)
Pacientský ID: NY-001234
Tlačidlo: 140/90 (OK — nie PII)
Diagnóza: Hypertenzie
História: Pracuje v IBM, bydlí v Manhattan, Telefón: 212-555-0123
Návšteva dátum: 15. máj 2024
Poznámka: Pacient je software inžinier s vysokom DPH.
HIPAA anonymizácia:
Pacient: 45-letý muž (Vek OK — bez presného dátumu narodenia)
Pacientský ID: [PATIENT_ID]
Tlačidlo: 140/90
Diagnóza: Hypertenzie
História: Pracuje v [EMPLOYER], bydlí v [LOCATION], Telefón: [PHONE]
Návšteva dátum: [DATE_OF_VISIT]
Poznámka: Pacient je software inžinier s vysokom DPH.
Technické Detekcia
Ako Nástroj Detekuje Všetkých 18:
| ID | Identifikátor | Detekcia Metóda | Príklad |
|---|---|---|---|
| 1 | Meno pacienta | NLP (meno rozpoznávania) | "John Smith" → [PATIENT_NAME] |
| 2 | Geografické | Gazetteer lookup (mestá, ZIP) | "New York, NY 10001" → [LOCATION] |
| 3 | Dátumy | Regex + Date parsing | "2024-05-15" → [DATE] |
| 4 | Telefón | Regex | "(555) 123-4567" → [PHONE] |
| 5 | Regex | "john@example.com" → [EMAIL] | |
| 6 | SSN | Regex + Checksum | "123-45-6789" → [SSN] |
| 7 | Medicín. záznam | Regex (počet + číslo) | "#987654321" → [MRN] |
| 8 | Zdravotnícka poisť. | Regex | "ABC123456789" → [INSURANCE] |
| 9 | Podľa schém | Lookup tabuľka | "Medicare ABC-DC-DEF" → [HEALTH_PLAN] |
| 10 | Čísla účtov | Regex (6–17 číslic) | "12345678901" → [ACCOUNT_NUM] |
| 11 | VIN | Regex (17 znakov) | "WVWZZZ3CZ0E123456" → [VIN] |
| 12 | Sériové čísla | Regex (alfa-čísl. + čísla) | "SN-123456-A" → [SERIAL_NUM] |
| 13 | Iný identifikátor | Regex (počet + číslo v kontexte) | "Student #12345" → [IDENTIFIER] |
| 14 | Obrázok | Computer vision (obraz analýza) | Obraz s tvárou → [IMAGE] |
| 15 | URL | Regex (s výnimkou domény) | "https://example.com/patient/123" → [URL] |
| 16 | IP adresa | Regex | "192.168.1.1" → [IP_ADDRESS] |
| 17 | Biometrická | Regex (otisková, retina) | "Otisková: 00A4A00D01DD" → [BIOMETRIC] |
| 18 | Iný jedinečný | Context + Regex | "Pacient 001" v zdravotníckej správy → [UNIQUE_ID] |
Výzvy Detekcia
Výzva 1: Geografická Polohy
- „New York" = Mestný (anonymizovať)
- „New York" v mene (John New York) = Meno (anonymizovať — ale iný identifikátor)
- Ako rozlíšiť? Kontext.
Výzva 2: Dátumy
- „2024-05-15" = Anonymizovať
- „May 15" bez roku = OK (podľa HIPAA)
- „1950-05-15" s pacientom > 90 rokov starým = OK (rok sa môže ponechať)
- Ako vedieť vek pacienta bez iného PII? Nástroj musí mať kontext.
Výzva 3: Čísla
- „123456789" = Príliš krátke na SSN, príliš dlhé na ZIP — potrebá kontextu
- Medicínsky záznam ID = "987654321", SSN = "123-45-6789"
- Ako rozlíšiť? Kontext.
Budúcosť: Kontextové Detekcia
Budúcnosť HIPAA detekcie je kontextové detekcia:
- NLP model vidí: "Pacient: John Smith, narodený 01/01/1980, diagnóza: Diabetu"
- Model chápe, že všetky sú spolu spojené — viete identifikátor pacienta
- Anonymizácia je všeobecný a úplný
Klávesnica správu: HIPAA 18 identifikátorov vyžadujú kontextovú detekciu — žiadny nástroj nie je 100% presný bez kontext.