De 18-Identificatievereiste
De Privacy Rule van HIPAA (45 CFR Sectie 164.514) specificeert de Safe Harbor-anonimisering methode: om beschermde gezondheidsinformatie te anonimiseren, moeten 18 specifieke identificatiecategorieën worden verwijderd. De Safe Harbor-methode is een van de twee HIPAA-anonimisering benaderingen; het wordt vaker gebruikt omdat de naleving deterministisch is — als alle 18 categorieën zijn verwijderd, is de data wettelijk geanonimiseerd.
De 18 categorieën:
- Namen
- Geografische gegevens (kleiner dan staat — inclusief straatadres, stad, county, postcode)
- Data (behalve jaar) gerelateerd aan de persoon — geboorte, opname, ontslag, overlijden
- Telefoonnummers
- Faxnummers
- E-mailadressen
- Sociale Zekerheidsnummers
- Medische recordnummers (MRN's)
- Nummer van de gezondheidsplanbegunstigde
- Rekennummers
- Certificaat-/licentienummers
- Voertuigidentificatoren en serienummers
- Apparaatidentificatoren en serienummers
- Web-URL's
- IP-adressen
- Biometrische identificatoren (vingerafdrukken, stemafdrukken)
- Volledige gezichtsfoto's en vergelijkbare afbeeldingen
- Elk ander uniek identificatienummer of -code
De meeste PII-detectietools detecteren betrouwbaar de categorieën 1, 4, 6 en 7 — namen, telefoonnummers, e-mailadressen en SSN's. Ze falen systematisch op de categorieën 8, 9, 10, 11, 13 en 18.
De MRN Detectiekloof
Medische recordnummers worden expliciet vermeld als een PHI-identificator (categorie 8). MRN-formaten zijn instelling-specifiek — er is geen gestandaardiseerd nationaal formaat. Ziekenhuis A gebruikt een 7-cijferig geheel getal. Ziekenhuis B gebruikt "PT-YYYYNNNN" waar YYYY het jaar is en NNNN een volgnummer is. Ziekenhuis C gebruikt een alfanumerieke string van 8 tekens. Ziekenhuis D gebruikt "MRN: " gevolgd door een 9-cijferig nummer.
Een generieke PII-detectietool die het MRN-formaat van Ziekenhuis B niet kent, zal "PT-2024-8847" niet detecteren als een PHI-identificator. Het document dat dit MRN bevat, zal na standaardverwerking als geanonimiseerd worden behandeld — terwijl dat niet het geval is.
Dit creëert een nalevingsfoutmodus die onzichtbaar is voor de organisatie: de anonimisatie lijkt compleet omdat de tool geen schendingen heeft gemarkeerd. De ontbrekende detectie is het probleem.
De Oplossing voor Aangepaste Entiteiten
Zorgorganisaties die MRN-detectie nodig hebben, hebben drie opties. Ten eerste, implementeer de detectie direct in Presidio — wat Python-programmeerexpertise en voortdurende onderhoud vereist naarmate MRN-formaten evolueren. Ten tweede, onderhoud een handmatige beoordelingsstap specifiek voor MRN's — wat een systematische zwakke schakel in de anonimiseringspipeline creëert. Ten derde, gebruik een systeem dat AI-ondersteunde creatie van aangepaste entiteiten biedt zonder dat code vereist is.
De AI-patroonhelperbenadering: het klinische informaticateam levert 5 voorbeeld MRN-waarden (SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001) en vraagt om een detectiepatroon. De AI genereert een regex — SVHS-d{7} — en valideert deze tegen de geleverde voorbeelden. Het patroon wordt opgeslagen in de HIPAA-nalevingspreset van het team. Alle daaropvolgende anonimiseringssessies detecteren dit MRN-formaat automatisch.
Dezelfde aanpak geldt voor andere instelling-specifieke identificatoren: formaten van nummers van gezondheidsplanbegunstigden, formaten van serienummers van apparatuur, en alle eigendomsidentificatiecodes die specifiek zijn voor de organisatie.
Bronnen: