Il requisito dei 18 identificatori
La Regola sulla Privacy dell'HIPAA (45 CFR Sezione 164.514) specifica il metodo di de-identificazione Safe Harbor: per de-identificare le informazioni sanitarie protette, devono essere rimossi 18 specifici categorie di identificatori. Il metodo Safe Harbor è uno dei due approcci di de-identificazione HIPAA; è più comunemente usato perché la conformità è deterministica: se tutte le 18 categorie vengono rimosse, i dati sono de-identificati per legge.
Le 18 categorie:
- Nomi
- Dati geografici (più piccoli dello stato — inclusi indirizzo, città, contea, codice postale)
- Date (eccetto l'anno) relative all'individuo — nascita, ammissione, dimissione, morte
- Numeri di telefono
- Numeri di fax
- Indirizzi email
- Numeri di previdenza sociale
- Numeri di registrazione medica (MRN)
- Numeri di beneficiari del piano sanitario
- Numeri di conto
- Numeri di certificato/licenza
- Identificatori e numeri di serie dei veicoli
- Identificatori e numeri di serie dei dispositivi
- URL web
- Indirizzi IP
- Identificatori biometrici (impronte digitali, impronte vocali)
- Fotografie a volto intero e immagini comparabili
- Qualsiasi altro numero o codice identificativo unico
La maggior parte degli strumenti di rilevamento PII rileva in modo affidabile le categorie 1, 4, 6 e 7 — nomi, numeri di telefono, indirizzi email e numeri di previdenza sociale. Falliscono sistematicamente sulle categorie 8, 9, 10, 11, 13 e 18.
Il divario di rilevamento MRN
I numeri di registrazione medica sono esplicitamente elencati come identificatore PHI (categoria 8). I formati MRN sono specifici per istituzione — non esiste un formato nazionale standardizzato. L'ospedale A utilizza un intero a 7 cifre. L'ospedale B utilizza "PT-YYYYNNNN" dove YYYY è l'anno e NNNN è un numero di sequenza. L'ospedale C utilizza una stringa alfanumerica di 8 caratteri. L'ospedale D utilizza "MRN: " seguito da un numero a 9 cifre.
Uno strumento di rilevamento PII generico che non conosce il formato MRN dell'ospedale B non rileverà "PT-2024-8847" come identificatore PHI. Il documento contenente questo MRN sarà trattato come de-identificato dopo un'elaborazione standard — quando non lo è.
Questo crea una modalità di fallimento della conformità che è invisibile all'organizzazione: la de-identificazione appare completa perché lo strumento non ha segnalato violazioni. La mancanza di rilevamento è il problema.
La soluzione per entità personalizzate
Le organizzazioni sanitarie che necessitano di rilevamento MRN hanno tre opzioni. Prima, implementare il rilevamento in Presidio direttamente — richiedendo competenze di programmazione Python e manutenzione continua man mano che i formati MRN evolvono. Secondo, mantenere un passaggio di revisione manuale specificamente per i MRN — creando un anello debole sistematico nella pipeline di de-identificazione. Terzo, utilizzare un sistema che fornisca creazione di entità personalizzate assistita da AI senza richiedere codice.
L'approccio dell'assistente di pattern AI: il team di informatica clinica fornisce 5 valori MRN di esempio (SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001) e richiede un pattern di rilevamento. L'AI genera una regex — SVHS-d{7} — e la convalida rispetto agli esempi forniti. Il pattern viene salvato nel preset di conformità HIPAA del team. Tutte le sessioni di de-identificazione successive rilevano automaticamente questo formato MRN.
Lo stesso approccio si applica ad altri identificatori specifici per istituzione: formati di numeri di beneficiari del piano sanitario, formati di numeri di serie delle attrezzature e qualsiasi codice identificativo proprietario specifico per l'organizzazione.
Fonti: