El problema de los formatos MRN
Estados Unidos tiene alrededor de 6.100 hospitales. Cada uno opera su propio sistema EHR. Cada uno usa su propio formato de número de historia clínica (Medical Record Number). No existe ningún estándar nacional. La Joint Commission solo exige que los sistemas identifiquen a los pacientes de forma única — no cómo.
Los formatos varían mucho. Algunos son enteros de 7 dígitos. Otros son de 8 dígitos. Algunos usan prefijos como HOSP-, MRN- o PT-. Otros añaden códigos de institución como SVHS- o CHOP-. Algunos incorporan el año de ingreso en el número.
HIPAA Safe Harbor clasifica los números de historia clínica como identificador tipo 8 de 18. (45 CFR §164.514(b)(2)) Los 18 deben eliminarse. La norma no limita ningún formato. Si su hospital usa un formato personalizado, debe detectarse. Una herramienta que lo omita no cumple Safe Harbor — aunque elimine los otros 17 tipos.
Por qué falla el enfoque con código
La forma estándar de añadir un formato de número personalizado a un pipeline de desidentificación es extender Microsoft Presidio. Eso implica escribir Python.
Un desarrollador crea una clase que extiende EntityRecognizer. Escribe el regex, lo integra en el registro de Presidio, lo prueba y lo mantiene. Para los equipos de cumplimiento — que rara vez programan — esto es un bloqueo duro. Cada cambio de formato requiere un ingeniero.
Los equipos de ingeniería en salud están ocupados. Gestionan la integración EHR y los sistemas clínicos. Las herramientas de cumplimiento rara vez son prioritarias.
El flujo de trabajo sin código
El enfoque guiado elimina el paso de programación.
Un responsable de cumplimiento abre el Custom Entity Creator en la aplicación web. Pega cinco números de ejemplo de su sistema — por ejemplo:
SVHS-0012345
SVHS-0987654
SVHS-1122334
SVHS-4455667
SVHS-8899001
Hace clic en Generar patrón. La IA lee la estructura y devuelve:
- Patrón:
SVHS-\d{7} - Confianza: alta
- Nombre sugerido:
HOSPITAL-MRN - Reemplazo sugerido:
[MRN]
El responsable pega cinco ejemplos más. El patrón pasa. Lo guarda en el preset HIPAA.
A partir de ese momento, cada sesión — aplicación web, complemento de Office, aplicación de escritorio y API — detecta este formato en el paso PHI estándar. Sin código.
Nota sobre el RGPD y la investigación
El artículo 89 del RGPD exige pseudonimización para los conjuntos de datos de investigación. Las entidades personalizadas garantizan que los identificadores específicos de la institución estén en el ámbito — cerrando la brecha que las herramientas genéricas dejan abierta para los formatos propietarios.
Qué se obtiene
Este flujo de trabajo toma una tarde. El código personalizado tarda semanas.
El responsable de cumplimiento define el patrón, lo prueba y lo despliega. Sin ticket. Sin espera. El preset contiene la entidad personalizada junto a los 17 identificadores estándar de Safe Harbor.
En el siguiente lote de notas clínicas, los 18 tipos de identificadores quedan cubiertos. Safe Harbor está completo.
Ver desidentificación HIPAA Safe Harbor para investigación sanitaria. Para patrones de detección específicos por hospital: detectar formatos MRN hospitalarios sin programar.