Die Anforderung der 18 Identifikatoren
Die Datenschutzregel von HIPAA (45 CFR Abschnitt 164.514) spezifiziert die Safe Harbor-Anonymisierungsmethode: Um geschützte Gesundheitsinformationen zu anonymisieren, müssen 18 spezifische Identifikator-Kategorien entfernt werden. Die Safe Harbor-Methode ist eine von zwei HIPAA-Anonymisierungsmethoden; sie wird häufiger verwendet, da die Einhaltung deterministisch ist — wenn alle 18 Kategorien entfernt werden, sind die Daten rechtlich anonymisiert.
Die 18 Kategorien:
- Namen
- Geografische Daten (kleiner als Bundesstaat — einschließlich Straßenadresse, Stadt, Landkreis, PLZ)
- Daten (außer Jahr), die mit der Person in Verbindung stehen — Geburt, Aufnahme, Entlassung, Tod
- Telefonnummern
- Faxnummern
- E-Mail-Adressen
- Sozialversicherungsnummern
- Medizinische Aufzeichnungsnummern (MRNs)
- Nummern der Gesundheitsplanbegünstigten
- Kontonummern
- Zertifikats-/Lizenznummern
- Fahrzeugidentifikatoren und Seriennummern
- Geräteidentifikatoren und Seriennummern
- Web-URLs
- IP-Adressen
- Biometrische Identifikatoren (Fingerabdrücke, Sprachmuster)
- Vollgesichtsfotos und vergleichbare Bilder
- Jede andere einzigartige Identifikationsnummer oder -code
Die meisten PII-Erkennungstools erkennen zuverlässig die Kategorien 1, 4, 6 und 7 — Namen, Telefonnummern, E-Mail-Adressen und Sozialversicherungsnummern. Sie versagen systematisch bei den Kategorien 8, 9, 10, 11, 13 und 18.
Die MRN-Erkennungslücke
Medizinische Aufzeichnungsnummern sind ausdrücklich als PHI-Identifikator (Kategorie 8) aufgeführt. MRN-Formate sind institutionsspezifisch — es gibt kein standardisiertes nationales Format. Krankenhaus A verwendet eine 7-stellige Ganzzahl. Krankenhaus B verwendet "PT-YYYYNNNN", wobei YYYY das Jahr und NNNN eine Sequenznummer ist. Krankenhaus C verwendet eine alphanumerische 8-Zeichen-Zeichenfolge. Krankenhaus D verwendet "MRN: " gefolgt von einer 9-stelligen Zahl.
Ein generisches PII-Erkennungstool, das das MRN-Format von Krankenhaus B nicht kennt, wird "PT-2024-8847" nicht als PHI-Identifikator erkennen. Das Dokument, das diese MRN enthält, wird nach der Standardverarbeitung als anonymisiert behandelt — was es nicht ist.
Dies schafft einen Compliance-Fehlermodus, der für die Organisation unsichtbar ist: Die Anonymisierung scheint vollständig, weil das Tool keine Verstöße markiert hat. Die fehlende Erkennung ist das Problem.
Die benutzerdefinierte Entität-Lösung
Gesundheitsorganisationen, die eine MRN-Erkennung benötigen, haben drei Optionen. Erstens, die Erkennung direkt in Presidio implementieren — was Python-Programmierungskenntnisse und laufende Wartung erfordert, während sich die MRN-Formate weiterentwickeln. Zweitens, einen manuellen Überprüfungsschritt speziell für MRNs aufrechterhalten — was eine systematische Schwachstelle in der Anonymisierungspipeline schafft. Drittens, ein System verwenden, das KI-unterstützte benutzerdefinierte Entitätserstellung bietet, ohne dass Code erforderlich ist.
Der Ansatz des KI-Musterhelfers: Das klinische Informatikteam stellt 5 Beispiel-MRN-Werte (SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001) zur Verfügung und fordert ein Erkennungsmuster an. Die KI generiert einen Regex — SVHS-d{7} — und validiert ihn anhand der bereitgestellten Beispiele. Das Muster wird im HIPAA-Compliance-Voreinstellung des Teams gespeichert. Alle nachfolgenden Anonymisierungssitzungen erkennen dieses MRN-Format automatisch.
Der gleiche Ansatz gilt für andere institutionsspezifische Identifikatoren: Formate von Gesundheitsplanbegünstigtenummern, Formate von Geräteseriennummern und alle proprietären Identifizierungscodes, die spezifisch für die Organisation sind.
Quellen: