Anonimizar HCE para explotación secundaria con fines de investigación biomédica y salud pública – Anonimización conforme al RGPD según RGPD art. 9(2)(j); RGPD art. 89; LOPDGDD Disposición Adicional Decimoséptima; Ley 41/2002 art. 16

La reutilización de la historia clínica electrónica con fines de investigación biomédica o salud pública —habilitada por el RGPD art. 9(2)(j), el art. 89 y la LOPDGDD Disposición Adicional Decimoséptima— requiere que los datos se traten con las garantías técnicas necesarias para proteger la identidad del paciente. anonym.legal implementa pipelines de anonimización escalables para grandes conjuntos de HCE.

Cuándo se aplica

Aplica cuando hospitales, redes de investigación o plataformas de datos de salud necesitan crear conjuntos de datos anonimizados a partir de la HCE para proyectos de investigación aprobados, análisis de salud poblacional o modelos de IA clínica, conforme a la LOPDGDD DA 17ª.

Cómo lo gestiona anonym.legal

Define el proyecto de investigación y documenta la base jurídica (RGPD art. 9(2)(j) o LOPDGDD DA 17ª) con el DPO del centro.
Exporta la cohorte de HCE relevante para el proyecto desde el sistema de información hospitalario en formato HL7 FHIR o CSV estructurado.
Carga el conjunto en anonym.legal; el motor aplica el pipeline de anonimización estructurada: supresión de identificadores directos, generalización de cuasi-identificadores, perturbación de fechas y k-anonimato sobre las variables configuradas.
Las notas clínicas en texto libre se procesan con NLP para detectar y suprimir entidades nombradas (nombres de personas, lugares, fechas absolutas).
El motor evalúa el riesgo de reidentificación del conjunto resultante y emite un informe de calidad de anonimización.
Si el riesgo residual supera el umbral configurado, el sistema propone ajustes adicionales (mayor k, supresión de variables, generalización adicional).
El conjunto de datos anonimizado aprobado se entrega al equipo de investigación en formato CSV, JSON o HL7 FHIR anonimizado.

Qué proporciona usted

Protocolo de investigación aprobado por comité de ética y base jurídica documentada
Exportación de HCE en HL7 FHIR, CDA o CSV estructurado
Variables de interés para la investigación (diagnósticos, procedimientos, medicación, laboratorio)
Parámetros de anonimización (k, umbral de riesgo residual máximo aceptable)

Limitaciones y precauciones

La explotación secundaria de la HCE debe estar amparada en uno de los supuestos habilitantes de la LOPDGDD DA 17ª; anonym.legal no evalúa la adecuación de la base jurídica, que corresponde al DPO y al comité de ética.
Las notas clínicas en texto libre con alta especificidad clínica pueden requerir revisión manual adicional pese al NLP; se recomienda auditoría de muestra.
Para proyectos que involucren datos genéticos o biobanco, la Ley 14/2007 arts. 50-55 y 58 establece requisitos adicionales de consentimiento y gestión.
El RGPD art. 35 puede exigir una EIPD antes del inicio del proyecto de explotación secundaria a gran escala.

Preguntas frecuentes

¿Qué exige la LOPDGDD Disposición Adicional Decimoséptima para la investigación con datos de salud?

La LOPDGDD DA 17ª habilita el tratamiento secundario de datos de salud para investigación sin consentimiento del paciente cuando exista un interés público legítimo, se apliquen medidas técnicas y organizativas adecuadas (incluida la anonimización cuando sea posible) y el tratamiento esté supervisado por el DPO. El centro sanitario debe documentar cada proyecto.

¿Puede la plataforma procesar HCE de múltiples hospitales de una red de investigación?

Sí. anonym.legal puede procesar conjuntos federados de HCE de múltiples centros, asignando un identificador pseudónimo consistente entre centros antes de la anonimización final. Este enfoque permite análisis multicéntricos sin que ningún centro vea los datos de los otros.

¿Qué es el k-anonimato y por qué es relevante en este contexto?

El k-anonimato garantiza que cada combinación de cuasi-identificadores (p.ej. sexo + edad quinquenal + código postal + diagnóstico principal) aparece al menos k veces en el conjunto de datos, haciendo imposible distinguir a un individuo de otros k-1. Para HCE se recomienda k≥5 como mínimo y k≥10 para patologías con baja prevalencia.

Datos Sanitarios

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

We follow these rules

GDPR (EU 2016/679).
ISO/IEC 27001:2022.
NIS2 (EU 2022/2555).
HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

We never sell your information to third parties.
We never train models on what you upload.
We never keep your work after you delete it.
We never share keys with any outside firm.
We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.