Tilbage til BlogSundhedspleje

De 18 HIPAA-identifikatorer, som dit PII-værktøj...

HIPAA opregner 18 PHI-identifikatorer. De fleste anonymisering værktøjer opdager måske 6 af dem.

April 20, 20269 min læsning
HIPAA 18 identifiersPHI complete detectionMRN detectionNPI DEA numbersHIPAA Safe Harbor compliance

Kravet om 18 identifikatorer

HIPAA's privatlivsregel (45 CFR Section 164.514) specificerer Safe Harbor de-identifikationsmetoden: for at de-identificere beskyttede sundhedsoplysninger skal 18 specifikke identifikator-kategorier fjernes. Safe Harbor-metoden er en af to HIPAA de-identifikationsmetoder; den er mere almindeligt anvendt, fordi overholdelse er deterministisk — hvis alle 18 kategorier fjernes, er dataene de-identificerede som et spørgsmål om lov.

De 18 kategorier:

  1. Navne
  2. Geografiske data (mindre end stat — inklusive gadeadresse, by, amt, postnummer)
  3. Datoer (undtagen år) relateret til individet — fødsel, indlæggelse, udskrivning, død
  4. Telefonnummer
  5. Faxnumre
  6. E-mailadresser
  7. Social Security numre
  8. Medicinske journalnumre (MRNs)
  9. Sundhedsplanens begunstigede numre
  10. Kontonumre
  11. Certifikat-/licensnumre
  12. Køretøjsidentifikatorer og serienumre
  13. Enhedsidentifikatorer og serienumre
  14. Web-URL'er
  15. IP-adresser
  16. Biometriske identifikatorer (fingeraftryk, stemmeaftryk)
  17. Ful ansigt fotografier og sammenlignelige billeder
  18. Ethvert andet unikt identificerende nummer eller kode

De fleste PII-detekteringsværktøjer opdager pålideligt kategorierne 1, 4, 6 og 7 — navne, telefonnumre, e-mailadresser og SSNs. De fejler systematisk på kategorierne 8, 9, 10, 11, 13 og 18.

MRN-detekteringskløften

Medicinske journalnumre er eksplicit opført som en PHI-identifikator (kategori 8). MRN-formater er institutionsspecifikke — der er ikke noget standardiseret nationalt format. Hospital A bruger et 7-cifret heltal. Hospital B bruger "PT-YYYYNNNN" hvor YYYY er år og NNNN er et sekvensnummer. Hospital C bruger en alfanumerisk 8-tegns streng. Hospital D bruger "MRN: " efterfulgt af et 9-cifret nummer.

Et generisk PII-detekteringsværktøj, der ikke kender Hospital B's MRN-format, vil ikke opdage "PT-2024-8847" som en PHI-identifikator. Dokumentet, der indeholder dette MRN, vil blive behandlet som de-identificeret efter standardbehandling — når det ikke er.

Dette skaber en overholdelsesfejltilstand, der er usynlig for organisationen: de-identifikationen synes at være komplet, fordi værktøjet ikke har markeret nogen overtrædelser. Den manglende detektion er problemet.

Løsningen med brugerdefinerede enheder

Sundhedsorganisationer, der har brug for MRN-detektion, har tre muligheder. For det første, implementere detektion direkte i Presidio — hvilket kræver Python-programmeringskompetence og løbende vedligeholdelse, efterhånden som MRN-formater udvikler sig. For det andet, opretholde et manuelt gennemgangstrin specifikt for MRNs — hvilket skaber et systematisk svagt led i de-identifikationspipeline. For det tredje, bruge et system, der tilbyder AI-assisteret oprettelse af brugerdefinerede enheder uden at kræve kode.

AI-mønsterhjælper tilgang: det kliniske informatikteam leverer 5 prøve MRN-værdier (SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001) og anmoder om et detektionsmønster. AI genererer en regex — SVHS-d{7} — og validerer den mod de angivne eksempler. Mønsteret gemmes i teamets HIPAA-overholdelsespræference. Alle efterfølgende de-identifikationssessioner opdager automatisk dette MRN-format.

Den samme tilgang gælder for andre institutionsspecifikke identifikatorer: sundhedsplanens begunstigede nummerformater, udstyrsserienummerformater og eventuelle proprietære identificeringskoder, der er specifikke for organisationen.

Kilder:

Klar til at beskytte dine data?

Begynd at anonymisere PII med 285+ enhedstyper på tværs af 48 sprog.