Kravet på 18 identifikatorer
HIPAA:s sekretessregel (45 CFR Section 164.514) specificerar metoden för Safe Harbor avidentifiering: för att avidentifiera skyddad hälsinformation måste 18 specifika identifikatorer tas bort. Safe Harbor-metoden är en av två HIPAA-avidentifieringsmetoder; den används oftare eftersom efterlevnaden är deterministisk — om alla 18 kategorier tas bort, är datan avidentifierad enligt lag.
De 18 kategorierna:
- Namn
- Geografiska data (mindre än stat — inklusive gatuadress, stad, län, postnummer)
- Datum (utom år) relaterade till individen — födelse, inläggning, utskrivning, död
- Telefonnummer
- Faxnummer
- E-postadresser
- Socialförsäkringsnummer
- Medicinska journalnummer (MRN)
- Försäkringsnummer för hälsoförmåner
- Kontonummer
- Certifikat/licensnummer
- Fordonsidentifierare och serienummer
- Enhetsidentifierare och serienummer
- Webb-URL:er
- IP-adresser
- Biometriska identifierare (fingeravtryck, röstavtryck)
- Hela ansiktsfoton och jämförbara bilder
- Alla andra unika identifierande nummer eller koder
De flesta PII-detekteringsverktyg upptäcker pålitligt kategorierna 1, 4, 6 och 7 — namn, telefonnummer, e-postadresser och SSN. De misslyckas systematiskt med kategorierna 8, 9, 10, 11, 13 och 18.
Gapet i MRN-detektion
Medicinska journalnummer listas uttryckligen som en PHI-identifikator (kategori 8). MRN-format är institutionsspecifika — det finns inget standardiserat nationellt format. Sjukhus A använder ett 7-siffrigt heltal. Sjukhus B använder "PT-YYYYNNNN" där YYYY är år och NNNN är ett sekvensnummer. Sjukhus C använder en alfanumerisk 8-teckens sträng. Sjukhus D använder "MRN: " följt av ett 9-siffrigt nummer.
Ett generiskt PII-detekteringsverktyg som inte känner till sjukhus B:s MRN-format kommer inte att upptäcka "PT-2024-8847" som en PHI-identifikator. Dokumentet som innehåller detta MRN kommer att behandlas som avidentifierat efter standardbehandling — när det inte är det.
Detta skapar ett efterlevnadsfel som är osynligt för organisationen: avidentifieringen verkar vara komplett eftersom verktyget inte markerade några överträdelser. Den saknade detektionen är problemet.
Lösningen med anpassade enheter
Vårdenheter som behöver MRN-detektion har tre alternativ. Först, implementera detektion direkt i Presidio — vilket kräver expertis inom Python-programmering och pågående underhåll när MRN-format utvecklas. För det andra, upprätthålla ett manuellt granskningssteg specifikt för MRN — vilket skapar en systematisk svag länk i avidentifieringsprocessen. För det tredje, använd ett system som tillhandahåller AI-assisterad skapelse av anpassade enheter utan att kräva kod.
AI-mönsterhjälparmetoden: det kliniska informatikteamet tillhandahåller 5 exempel på MRN-värden (SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001) och begär ett detektionsmönster. AI genererar en regex — SVHS-d{7} — och validerar den mot de angivna exemplen. Mönstret sparas i teamets HIPAA-efterlevnadspreset. Alla efterföljande avidentifieringssessioner upptäcker automatiskt detta MRN-format.
Samma metod gäller för andra institutionsspecifika identifierare: format för försäkringsnummer för hälsoförmåner, format för utrustningens serienummer och alla proprietära identifieringskoder som är specifika för organisationen.
Källor: