Kravet om 18 identifikatorer
HIPAA's privatlivsregel (45 CFR Section 164.514) specificerer Safe Harbor de-identifikationsmetoden: for at de-identificere beskyttede sundhedsoplysninger skal 18 specifikke identifikator-kategorier fjernes. Safe Harbor-metoden er en af to HIPAA de-identifikationsmetoder; den er mere almindeligt anvendt, fordi overholdelse er deterministisk — hvis alle 18 kategorier fjernes, er dataene de-identificerede som et spørgsmål om lov.
De 18 kategorier:
- Navne
- Geografiske data (mindre end stat — inklusive gadeadresse, by, amt, postnummer)
- Datoer (undtagen år) relateret til individet — fødsel, indlæggelse, udskrivning, død
- Telefonnummer
- Faxnumre
- E-mailadresser
- Social Security numre
- Medicinske journalnumre (MRNs)
- Sundhedsplanens begunstigede numre
- Kontonumre
- Certifikat-/licensnumre
- Køretøjsidentifikatorer og serienumre
- Enhedsidentifikatorer og serienumre
- Web-URL'er
- IP-adresser
- Biometriske identifikatorer (fingeraftryk, stemmeaftryk)
- Ful ansigt fotografier og sammenlignelige billeder
- Ethvert andet unikt identificerende nummer eller kode
De fleste PII-detekteringsværktøjer opdager pålideligt kategorierne 1, 4, 6 og 7 — navne, telefonnumre, e-mailadresser og SSNs. De fejler systematisk på kategorierne 8, 9, 10, 11, 13 og 18.
MRN-detekteringskløften
Medicinske journalnumre er eksplicit opført som en PHI-identifikator (kategori 8). MRN-formater er institutionsspecifikke — der er ikke noget standardiseret nationalt format. Hospital A bruger et 7-cifret heltal. Hospital B bruger "PT-YYYYNNNN" hvor YYYY er år og NNNN er et sekvensnummer. Hospital C bruger en alfanumerisk 8-tegns streng. Hospital D bruger "MRN: " efterfulgt af et 9-cifret nummer.
Et generisk PII-detekteringsværktøj, der ikke kender Hospital B's MRN-format, vil ikke opdage "PT-2024-8847" som en PHI-identifikator. Dokumentet, der indeholder dette MRN, vil blive behandlet som de-identificeret efter standardbehandling — når det ikke er.
Dette skaber en overholdelsesfejltilstand, der er usynlig for organisationen: de-identifikationen synes at være komplet, fordi værktøjet ikke har markeret nogen overtrædelser. Den manglende detektion er problemet.
Løsningen med brugerdefinerede enheder
Sundhedsorganisationer, der har brug for MRN-detektion, har tre muligheder. For det første, implementere detektion direkte i Presidio — hvilket kræver Python-programmeringskompetence og løbende vedligeholdelse, efterhånden som MRN-formater udvikler sig. For det andet, opretholde et manuelt gennemgangstrin specifikt for MRNs — hvilket skaber et systematisk svagt led i de-identifikationspipeline. For det tredje, bruge et system, der tilbyder AI-assisteret oprettelse af brugerdefinerede enheder uden at kræve kode.
AI-mønsterhjælper tilgang: det kliniske informatikteam leverer 5 prøve MRN-værdier (SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001) og anmoder om et detektionsmønster. AI genererer en regex — SVHS-d{7} — og validerer den mod de angivne eksempler. Mønsteret gemmes i teamets HIPAA-overholdelsespræference. Alle efterfølgende de-identifikationssessioner opdager automatisk dette MRN-format.
Den samme tilgang gælder for andre institutionsspecifikke identifikatorer: sundhedsplanens begunstigede nummerformater, udstyrsserienummerformater og eventuelle proprietære identificeringskoder, der er specifikke for organisationen.
Kilder: