18 HIPAA-identifikatorer dit værktøj overser
Opdateret for 2026.
HIPAA lister 18 PHI-identifikatorkategorier. De fleste anonymiseringsværktøjer opdager måske seks. De øvrige tolv slipper igennem — og hver enkelt er et overholdelsesgab.
Safe Harbor-reglen
HIPAA's Privacy Rule (45 CFR § 164.514) definerer Safe Harbor-de-identifikation. Alle 18 identifikatorkategorier skal fjernes. Fjern enhver enkelt, og dataene er de-identificeret ved lov. Det er derfor Safe Harbor er populær: det er bestå eller dumpe, ikke et skønsspørgsmål.
De 18 kategorier er:
- Navne
- Geografiske data mindre end delstat — gadeadresse, by, amt, postnummer
- Datoer undtagen år — fødsel, indlæggelse, udskrivning, død
- Telefonnumre
- Faxnumre
- E-mailadresser
- Social Security-numre
- Medicinske journalidentifikatorer (MRN)
- Sundhedsplanens begunstigede-koder
- Kontoidentifikatorer
- Certifikat- og licenskoder
- Køretøjsidentifikatorer og serienumre
- Enhedsidentifikatorer og serienumre
- Web-URL'er
- IP-adresser
- Biometriske identifikatorer — fingeraftryk, stemmeprofiler
- Fuldansigts-fotos og lignende billeder
- Enhver anden unik identificerende kode eller værdi
De fleste værktøjer håndterer kategorierne 1, 4, 6 og 7 godt. De overser 8, 9, 10, 11, 13 og 18 rutinemæssigt.
MRN-gabet
Medicinske journalidentifikatorer er i kategori 8. MRN-formater fastsættes af hvert hospital. Der er ingen national amerikanskstandard.
Hospital A bruger et 7-cifret heltal. Hospital B bruger "PT-YYYYNNNN." Hospital C bruger en 8-tegns alfanumerisk streng. Hospital D skriver "MRN: " foran en 9-cifret kode.
Et generisk værktøj vil ikke markere "PT-2024-8847" som PHI. Dokumentet passerer de-identifikationstjek. Men det er ikke de-identificeret. Ingen alarm udløses. Teamet tror, jobbet er udført. Det er det ikke.
Dette er den værste slags gab: et stille et.
Tre måder at løse det på
Kod det i Presidio. Dette kræver Python-kompetencer og løbende vedligeholdelse. Det virker, men koster tid.
Tilføj manuel gennemgang. En person kontrollerer hvert dokument for MRN'er. Dette skalerer ikke.
Brug AI-assisteret oprettelse af brugerdefinerede entiteter. Ingen kode nødvendig. Teamet angiver eksempelværdier. AI'en bygger mønsteret.
Sådan fungerer det. Et team angiver fem eksempel-MRN-værdier: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. AI'en returnerer SVHS-\d{7} og kontrollerer det mod eksemplerne. Teamet gemmer det i deres HIPAA-forudindstilling. Alle fremtidige sessioner registrerer formatet. Den samme tilgang fungerer for begunstigede-koder og enhedsserienumre.
Se, hvordan forudindstillinger fungerer i HIPAA MRN-detektionsguiden. Lær om AI-mønster-arbejdsgangen.
Den skjulte antagelse
Mange teams tester på et eksempeldokument med et navn og et telefonnummer. Værktøjet består. De antager fuld dækning. Men eksempler inkluderer sjældent institutionsspecifikke identifikatorer. MRN'er og begunstigede-koder ser ud som tilfældige strenge for et generisk værktøj. De passerer uden markering.
En ægte Safe Harbor-revision kortlægger alle 18 kategorier til en detektionsmetode. For kategori 8: verificer med rigtige MRN-eksempler fra dit eget hospital. Antag ikke, at værktøjet kender dit format.
Gennemgå den fulde ramme i vores HIPAA-overensstemmelsesoversigt.
Konklusion
Safe Harbor kræver, at alle 18 identifikatorkategorier fjernes. Generiske værktøjer dækker langt færre. Gabbene — MRN'er, begunstigede-koder, enhedsserienumre — har intet standardformat, så generiske værktøjer overser dem. AI-assisterede brugerdefinerede entiteter lukker gabet uden kode eller manuel gennemgang.
Kilder
- HHS: HIPAA Safe Harbor, 45 CFR § 164.514 — hhs.gov. VERIFICERET.
- Shaip: PHI-identifikatortyper i sundhedsdata-de-identifikation — shaip.com. VERIFICERET-EKSTERNT.
- HHS OCR: De-identifikationsvejledning opdateret 2024 — hhs.gov. VERIFICERET.