Späť na blogZdravotná Starostlivosť

HIPAA 18 PHI Identifikátorov: Ako Detekcia Chápe...

HIPAA definuje 18 identifikátorov PHI (Protected Health Information). Všetkých 18 musia byť detekovaní a odstránení.

April 19, 20269 min čítania
HIPAA 18 identifiersPHI complete detectionMRN detectionNPI DEA numbersHIPAA Safe Harbor compliance

HIPAA 18 PHI Identifikátorov

HIPAA definuje 18 kategórií chránených zdravotných informácií, ktoré sa musí anonymizovať:

  1. Meno pacienta — Všetky mená a zmeny mena
  2. Geografické polohy — Mestá, mestá, okresy, štáty, ZIP kódy, krajiny
  3. Dátumy — Všetky dátumy (narodenie, prijatia, vypisovania) — s výnimkou roku, ak je > 90 rokov
  4. Telefónne čísla — Všetky telefonné čísla
  5. E-mailové adresy — Všetky e-mailové adresy
  6. Sociálne bezpečnostné čísla (SSN) — XXX-XX-XXXX
  7. Čísla medicínskych záznamov — Všetky čísla pacientov, čísla návštev
  8. Čísla zdravotného poistenia — Všetky čísla poistenia
  9. Čísla podlož na zdravú starostlivosť — Čísla podľa schém (Medicare, Medicaid, atď.)
  10. Čísla účtov — Všetky finanční čísla účtov
  11. Podľa VIN (Vehicle Identification Number) — Čísla vozidiel
  12. Podľa Sériové čísla zariadení — Počítačové čísla, sériové čísla prístrojov
  13. Akékoľvek iné jedinečné identifikačné číslo — Ako ID autora, študent čísla, zamestnaní čísla
  14. Fotografické prvky — Masky tváre, fotografie
  15. Webové adresy (URLs) — Všetky webové adresy okrem domény
  16. IP adresy — Všetky IP adresy
  17. Identifikátory biometrických údajov — Otisková prsta, retina, čeľusť
  18. Akákoľvek iná identifikácia čísla — Akákoľvek kombinácii textu a čísiel, ktorá identifikuje jednotlivca

Príklady

Príklad 1: Jednoduché medicínske záznamy

Medicínsky záznam:
- Pacient: John Smith (ID #1: Meno)
- Narodený: 01/01/1980 (ID #3: Dátum)
- Adresa: 123 Main St, New York, NY 10001 (ID #2: Geografická poloha)
- Telefón: (555) 123-4567 (ID #4: Telefón)
- Diagnóza: Diabetu typu 2

HIPAA anonymizácia:
- Pacient: [PATIENT_NAME]
- Narodený: [DATE_OF_BIRTH]
- Adresa: [LOCATION]
- Telefón: [PHONE]
- Diagnóza: Diabetu typu 2 (OK — nie je PII)

Príklad 2: Komplexné zdravotnícke dokumenty

Hospitalizáciou záznam:
- Pacient: Jane Doe
- Zdravotn. číslo: #987654321
- Zdravotňa poisť. číslo: ABC123456789
- Dátum prijatia: 2024-05-15
- Hlavný problém: Rozsiahla zlomenina
- Chirurg: Dr. Robert Johnson
- Zbor: Room 204, Floor 3, Building B, Nemocnica XYZ, Boston, MA
- Tele. číslo núdzové: (617) 555-1234
- E-mail: jane@example.com
- Sociálne číslo: 123-45-6789
- Diagnóza: ICD-10 S52.531A (Zlomenina polomerného kosti, pravá ruka)
- Lieková: Morfín 10mg IV

HIPAA anonymizácia:
- Pacient: [PATIENT_NAME]
- Zdravotn. číslo: [MEDICAL_RECORD_NUMBER]
- Zdravotňa poisť. číslo: [INSURANCE_NUMBER]
- Dátum prijatia: [DATE_OF_ADMISSION]
- Hlavný problém: Rozsiahla zlomenina (OK — symptóm)
- Chirurg: [PROVIDER_NAME]
- Zbor: [LOCATION]
- Tele. číslo núdzové: [PHONE]
- E-mail: [EMAIL]
- Sociálne číslo: [SSN]
- Diagnóza: ICD-10 S52.531A (OK — medicínska klasifikácia)
- Lieková: Morfín 10mg IV (OK — lieková, nie identifikátor)

Príklad 3: Klinická výskumn. poznámka

Poznámka:
Pacient: 45-letý muž z New York (meno nie je spomenuté)
Pacientský ID: NY-001234
Tlačidlo: 140/90 (OK — nie PII)
Diagnóza: Hypertenzie
História: Pracuje v IBM, bydlí v Manhattan, Telefón: 212-555-0123
Návšteva dátum: 15. máj 2024
Poznámka: Pacient je software inžinier s vysokom DPH.

HIPAA anonymizácia:
Pacient: 45-letý muž (Vek OK — bez presného dátumu narodenia)
Pacientský ID: [PATIENT_ID]
Tlačidlo: 140/90
Diagnóza: Hypertenzie
História: Pracuje v [EMPLOYER], bydlí v [LOCATION], Telefón: [PHONE]
Návšteva dátum: [DATE_OF_VISIT]
Poznámka: Pacient je software inžinier s vysokom DPH.

Technické Detekcia

Ako Nástroj Detekuje Všetkých 18:

IDIdentifikátorDetekcia MetódaPríklad
1Meno pacientaNLP (meno rozpoznávania)"John Smith" → [PATIENT_NAME]
2GeografickéGazetteer lookup (mestá, ZIP)"New York, NY 10001" → [LOCATION]
3DátumyRegex + Date parsing"2024-05-15" → [DATE]
4TelefónRegex"(555) 123-4567" → [PHONE]
5E-mailRegex"john@example.com" → [EMAIL]
6SSNRegex + Checksum"123-45-6789" → [SSN]
7Medicín. záznamRegex (počet + číslo)"#987654321" → [MRN]
8Zdravotnícka poisť.Regex"ABC123456789" → [INSURANCE]
9Podľa schémLookup tabuľka"Medicare ABC-DC-DEF" → [HEALTH_PLAN]
10Čísla účtovRegex (6–17 číslic)"12345678901" → [ACCOUNT_NUM]
11VINRegex (17 znakov)"WVWZZZ3CZ0E123456" → [VIN]
12Sériové číslaRegex (alfa-čísl. + čísla)"SN-123456-A" → [SERIAL_NUM]
13Iný identifikátorRegex (počet + číslo v kontexte)"Student #12345" → [IDENTIFIER]
14ObrázokComputer vision (obraz analýza)Obraz s tvárou → [IMAGE]
15URLRegex (s výnimkou domény)"https://example.com/patient/123" → [URL]
16IP adresaRegex"192.168.1.1" → [IP_ADDRESS]
17BiometrickáRegex (otisková, retina)"Otisková: 00A4A00D01DD" → [BIOMETRIC]
18Iný jedinečnýContext + Regex"Pacient 001" v zdravotníckej správy → [UNIQUE_ID]

Výzvy Detekcia

Výzva 1: Geografická Polohy

  • „New York" = Mestný (anonymizovať)
  • „New York" v mene (John New York) = Meno (anonymizovať — ale iný identifikátor)
  • Ako rozlíšiť? Kontext.

Výzva 2: Dátumy

  • „2024-05-15" = Anonymizovať
  • „May 15" bez roku = OK (podľa HIPAA)
  • „1950-05-15" s pacientom > 90 rokov starým = OK (rok sa môže ponechať)
  • Ako vedieť vek pacienta bez iného PII? Nástroj musí mať kontext.

Výzva 3: Čísla

  • „123456789" = Príliš krátke na SSN, príliš dlhé na ZIP — potrebá kontextu
  • Medicínsky záznam ID = "987654321", SSN = "123-45-6789"
  • Ako rozlíšiť? Kontext.

Budúcosť: Kontextové Detekcia

Budúcnosť HIPAA detekcie je kontextové detekcia:

  • NLP model vidí: "Pacient: John Smith, narodený 01/01/1980, diagnóza: Diabetu"
  • Model chápe, že všetky sú spolu spojené — viete identifikátor pacienta
  • Anonymizácia je všeobecný a úplný

Klávesnica správu: HIPAA 18 identifikátorov vyžadujú kontextovú detekciu — žiadny nástroj nie je 100% presný bez kontext.

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.