Le problème des formats MRN
Les États-Unis comptent environ 6 100 hôpitaux. Chacun gère son propre système EHR. Chacun utilise son propre format de numéro de dossier médical (Medical Record Number). Aucun standard national n'existe. La Joint Commission exige seulement que les systèmes identifient les patients de façon unique — pas comment.
Les formats varient beaucoup. Certains sont des entiers à 7 chiffres. D'autres à 8 chiffres. Certains utilisent des préfixes comme HOSP-, MRN- ou PT-. D'autres ajoutent un code d'établissement comme SVHS- ou CHOP-. Certains intègrent l'année d'admission dans le numéro.
HIPAA Safe Harbor classe les numéros de dossiers patients comme identifiant de type 8 sur 18. (45 CFR §164.514(b)(2)) Les 18 doivent être supprimés. La règle ne limite aucun format. Si votre hôpital utilise un format personnalisé, il doit être détecté. Un outil qui le manque échoue à Safe Harbor — même s'il supprime les 17 autres types.
Pourquoi l'approche par code échoue
La méthode standard pour ajouter un format de numéro personnalisé à un pipeline de dé-identification consiste à étendre Microsoft Presidio. Cela implique d'écrire du Python.
Un développeur crée une classe qui étend EntityRecognizer. Il écrit le regex, l'intègre au registre de Presidio, le teste et le maintient. Pour les équipes de conformité — qui codent rarement — c'est un blocage dur. Chaque changement de format nécessite un ingénieur.
Les équipes d'ingénierie en santé sont débordées. Elles gèrent l'intégration EHR et les systèmes cliniques. Les outils de conformité sont rarement prioritaires.
Le workflow sans code
L'approche guidée supprime l'étape de codage.
Un responsable de conformité ouvre le Custom Entity Creator dans l'application web. Il colle cinq exemples de numéros de son système — par exemple :
SVHS-0012345
SVHS-0987654
SVHS-1122334
SVHS-4455667
SVHS-8899001
Il clique sur Générer le modèle. L'IA lit la structure et retourne :
- Modèle :
SVHS-\d{7} - Confiance : élevée
- Nom suggéré :
HOSPITAL-MRN - Remplacement suggéré :
[MRN]
Le responsable colle cinq autres exemples. Le modèle passe. Il l'enregistre dans le preset HIPAA.
Dès lors, chaque session — application web, module Office, application bureau et API — détecte ce format dans le passage PHI standard. Aucun code requis.
Note RGPD pour les données de recherche
L'article 89 du RGPD impose la pseudonymisation pour les jeux de données de recherche. Les entités personnalisées garantissent que les identifiants spécifiques à l'établissement sont inclus dans la portée — comblant le vide que les outils génériques laissent pour les formats propriétaires.
Ce que vous obtenez
Ce workflow prend un après-midi. Le code personnalisé prend des semaines.
Le responsable de conformité définit le modèle, le teste et le déploie. Pas de ticket. Pas d'attente. Le preset contient l'entité personnalisée aux côtés des 17 identifiants Safe Harbor standard.
Lors du prochain lot de notes cliniques, les 18 types d'identifiants sont couverts. Safe Harbor est respecté.
Voir HIPAA Safe Harbor pour la recherche en santé. Pour les modèles de détection spécifiques aux hôpitaux : détecter les formats MRN hospitaliers sans code.