Retour au blogSanté

Détection personnalisée de MRN sans code...

Les numéros de dossier médical sont spécifiques à chaque hôpital — chaque système de santé utilise un format différent.

April 20, 20268 min de lecture
custom MRN detectionHIPAA pipeline configurationno-code regexAI pattern helperhospital identifier de-identification

Le problème de la fragmentation des formats de MRN

Les États-Unis comptent environ 6 100 hôpitaux, chacun utilisant son propre système de dossier de santé électronique avec son propre format de numéro de dossier médical. Il n'existe pas de norme nationale pour les MRN. La Joint Commission, qui accrédite les organisations de santé, précise que les MRN doivent identifier de manière unique les patients au sein d'un système — mais ne précise pas le format.

La conséquence : les formats de MRN dans la nature incluent des entiers à 7 chiffres, des entiers à 8 chiffres, des chaînes alphanumériques de longueurs variées, des chaînes formatées avec des codes préfixes (HOSP-, MRN-, PT-, PAT-), des codes institutionnels préfixés (SVHS-, CHOP-, MDACC-), et des formats encodés par date où l'année d'inscription est intégrée dans le numéro.

La méthode de dé-identification Safe Harbor de HIPAA liste les numéros de dossier médical comme catégorie 8 sur 18 identifiants qui doivent être supprimés (45 CFR Section 164.514(b)(2)). L'exigence n'est pas qualifiée par le format — tous les formats de MRN utilisés par l'organisation doivent être détectés et supprimés. Une organisation qui traite des notes cliniques sans détecter leur format spécifique de MRN ne respecte pas la dé-identification Safe Harbor de HIPAA, peu importe quels autres identifiants sont supprimés.

La barrière du codage

L'approche standard pour ajouter un format de MRN personnalisé à un pipeline de dé-identification nécessite de mettre en œuvre le format dans le cadre de reconnaissance personnalisé de Presidio. Cela implique :

Écrire une classe Python qui étend EntityRecognizer, définir le motif regex pour le format de MRN spécifique, implémenter la méthode analyze() qui applique le motif, ajouter le reconnaisseur au registre de Presidio, tester l'implémentation contre des échantillons représentatifs, et maintenir l'implémentation au fur et à mesure que le format évolue.

Pour les équipes d'informatique clinique sans expertise en Python — ce qui décrit la majorité du personnel de conformité et de confidentialité dans le secteur de la santé — cela crée une dépendance à l'équipe d'ingénierie pour chaque changement de format. Les ressources d'ingénierie dans les organisations de santé sont généralement allouées à l'intégration des DSE et au soutien à la décision clinique, et non à la configuration des outils de conformité.

L'assistant de motif IA

L'approche de création de motifs assistée par IA remplace le flux de travail de codage par une interface guidée :

L'équipe d'informatique clinique ouvre le Créateur d'entités personnalisées dans l'application web. Elle fournit 5 valeurs d'échantillon de MRN de son système (SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001). Elle clique sur "Générer le motif." L'IA analyse la structure de l'échantillon et retourne : le motif SVHS-d{7} correspond aux exemples fournis ; niveau de confiance élevé ; nom d'entité suggéré : HOSPITAL-MRN ; remplacement suggéré : [MRN]; test contre des échantillons supplémentaires pour valider.

L'équipe fournit 5 échantillons de test supplémentaires. Le motif valide correctement. L'entité personnalisée est enregistrée dans le préréglage de conformité HIPAA. Toutes les sessions de dé-identification suivantes — application web, complément Office, application de bureau et API — détectent automatiquement les MRN au format SVHS dans le cadre du passage standard de détection de PHI.

L'exemption de recherche GDPR en vertu de l'article 89 exige la pseudonymisation et la minimisation des données pour les ensembles de données de recherche. La création d'entités personnalisées garantit que les identifiants spécifiques à l'institution sont inclus dans le champ de pseudonymisation — comblant le vide de couverture que les outils génériques laissent ouvert pour les formats propriétaires.

Sources :

Prêt à protéger vos données ?

Commencez à anonymiser les PII avec plus de 285 types d'entités dans 48 langues.