Anonimizar HCE para explotación secundaria con fines de investigación biomédica y salud pública – Anonimización conforme al RGPD según RGPD art. 9(2)(j); RGPD art. 89; LOPDGDD Disposición Adicional Decimoséptima; Ley 41/2002 art. 16
La reutilización de la historia clínica electrónica con fines de investigación biomédica o salud pública —habilitada por el RGPD art. 9(2)(j), el art. 89 y la LOPDGDD Disposición Adicional Decimoséptima— requiere que los datos se traten con las garantías técnicas necesarias para proteger la identidad del paciente. anonym.legal implementa pipelines de anonimización escalables para grandes conjuntos de HCE.
Cuándo se aplica
Aplica cuando hospitales, redes de investigación o plataformas de datos de salud necesitan crear conjuntos de datos anonimizados a partir de la HCE para proyectos de investigación aprobados, análisis de salud poblacional o modelos de IA clínica, conforme a la LOPDGDD DA 17ª.
Cómo lo gestiona anonym.legal
- Define el proyecto de investigación y documenta la base jurídica (RGPD art. 9(2)(j) o LOPDGDD DA 17ª) con el DPO del centro.
- Exporta la cohorte de HCE relevante para el proyecto desde el sistema de información hospitalario en formato HL7 FHIR o CSV estructurado.
- Carga el conjunto en anonym.legal; el motor aplica el pipeline de anonimización estructurada: supresión de identificadores directos, generalización de cuasi-identificadores, perturbación de fechas y k-anonimato sobre las variables configuradas.
- Las notas clínicas en texto libre se procesan con NLP para detectar y suprimir entidades nombradas (nombres de personas, lugares, fechas absolutas).
- El motor evalúa el riesgo de reidentificación del conjunto resultante y emite un informe de calidad de anonimización.
- Si el riesgo residual supera el umbral configurado, el sistema propone ajustes adicionales (mayor k, supresión de variables, generalización adicional).
- El conjunto de datos anonimizado aprobado se entrega al equipo de investigación en formato CSV, JSON o HL7 FHIR anonimizado.
Qué proporciona usted
- Protocolo de investigación aprobado por comité de ética y base jurídica documentada
- Exportación de HCE en HL7 FHIR, CDA o CSV estructurado
- Variables de interés para la investigación (diagnósticos, procedimientos, medicación, laboratorio)
- Parámetros de anonimización (k, umbral de riesgo residual máximo aceptable)
Limitaciones y precauciones
- La explotación secundaria de la HCE debe estar amparada en uno de los supuestos habilitantes de la LOPDGDD DA 17ª; anonym.legal no evalúa la adecuación de la base jurídica, que corresponde al DPO y al comité de ética.
- Las notas clínicas en texto libre con alta especificidad clínica pueden requerir revisión manual adicional pese al NLP; se recomienda auditoría de muestra.
- Para proyectos que involucren datos genéticos o biobanco, la Ley 14/2007 arts. 50-55 y 58 establece requisitos adicionales de consentimiento y gestión.
- El RGPD art. 35 puede exigir una EIPD antes del inicio del proyecto de explotación secundaria a gran escala.
Preguntas frecuentes
¿Qué exige la LOPDGDD Disposición Adicional Decimoséptima para la investigación con datos de salud?
La LOPDGDD DA 17ª habilita el tratamiento secundario de datos de salud para investigación sin consentimiento del paciente cuando exista un interés público legítimo, se apliquen medidas técnicas y organizativas adecuadas (incluida la anonimización cuando sea posible) y el tratamiento esté supervisado por el DPO. El centro sanitario debe documentar cada proyecto.
¿Puede la plataforma procesar HCE de múltiples hospitales de una red de investigación?
Sí. anonym.legal puede procesar conjuntos federados de HCE de múltiples centros, asignando un identificador pseudónimo consistente entre centros antes de la anonimización final. Este enfoque permite análisis multicéntricos sin que ningún centro vea los datos de los otros.
¿Qué es el k-anonimato y por qué es relevante en este contexto?
El k-anonimato garantiza que cada combinación de cuasi-identificadores (p.ej. sexo + edad quinquenal + código postal + diagnóstico principal) aparece al menos k veces en el conjunto de datos, haciendo imposible distinguir a un individuo de otros k-1. Para HCE se recomienda k≥5 como mínimo y k≥10 para patologías con baja prevalencia.