Anonymiser les résultats d'examens biologiques pour recherche secondaire – Anonymisation conforme au RGPD selon RGPD art. 9 ; CSP L1110-4 ; Loi 78-17 art. 66
Les résultats d'examens biologiques — NFS, bilan hépatique, sérologies, génotypages — sont des données de santé sensibles au sens de l'article 9 du RGPD et soumis au secret professionnel (CSP L1110-4). Leur anonymisation irréversible ouvre la voie à une réutilisation pour la recherche secondaire dans le cadre de l'article 9(2)(j) RGPD et de la Loi 78-17 article 66.
Quand cela s'applique
Ce flux s'applique aux laboratoires d'analyses médicales et aux centres hospitaliers souhaitant valoriser leurs données biologiques pour des études rétrospectives, des publications ou le développement d'algorithmes diagnostiques, sans maintenir de lien avec l'identité des patients.
Comment anonym.legal s'en occupe
- Exportez les résultats biologiques depuis le SIH ou le LIMS au format CSV, HL7 ORU ou FHIR DiagnosticReport.
- Téléversez le fichier ; le moteur identifie les champs d'identité (nom, IPP, date de naissance, numéro de prélèvement, prescripteur).
- Les identifiants directs sont supprimés de manière irréversible.
- Les dates de prélèvement sont généralisées à la semaine ou au mois selon la granularité requise.
- Les valeurs numériques (concentrations, ratios) et les codes LOINC sont conservés sans modification.
- Un identifiant de cohorte aléatoire est attribué à chaque patient pour permettre des analyses longitudinales sans réidentification.
- Le jeu de données est exporté au format CSV ou FHIR pour intégration dans les outils d'analyse.
Ce que vous fournissez
- Résultats biologiques au format CSV, HL7 ORU ou FHIR DiagnosticReport
- Liste des analytes inclus et des codes LOINC correspondants
- Période couverte et granularité temporelle requise pour l'analyse
- Besoin de suivi longitudinal (identifiant de cohorte) ou analyse transversale uniquement
Limites & précautions
- Les données génomiques (séquençages, génotypages SNP) présentent un risque de réidentification très élevé — leur anonymisation nécessite des mesures supplémentaires au-delà de la suppression de l'identité et doit faire l'objet d'une AIPD (art. 35 RGPD).
- Les valeurs biologiques très rares ou hors normes peuvent être des quasi-identifiants ; une analyse de k-anonymité est recommandée avant partage.
- Le moteur ne valide pas la qualité analytique des résultats biologiques ni l'exactitude des codes LOINC.
FAQ
La conformité à la MR-004 CNIL est-elle suffisante pour réutiliser des résultats biologiques anonymisés ?
La CNIL MR-004 couvre les études n'impliquant pas la personne humaine au sens de la loi Jardé. Si les résultats biologiques ont été préalablement anonymisés de manière irréversible, ils sortent du champ du RGPD et les obligations de la MR-004 ne s'appliquent plus à leur réutilisation. Toutefois, si un doute subsiste sur l'irréversibilité, la MR-004 ou une autorisation CNIL reste recommandée.
Les données génomiques bénéficient-elles du même régime que les autres résultats biologiques ?
Non. Les données génétiques constituent une sous-catégorie spécifique de l'article 9 RGPD (données génétiques et données biométriques). Elles présentent un risque intrinsèque de réidentification même après suppression des identifiants directs. Leur traitement à des fins de recherche requiert une base légale spécifique (art. 9(2)(j) + art. 89 RGPD) et une AIPD systématique.
Peut-on coupler des résultats biologiques anonymisés avec d'autres bases de données publiques ?
Le couplage avec des bases publiques (registres de mortalité, données SNDS anonymisées) est envisageable mais doit être évalué au regard du risque de réidentification par croisement. Une analyse de linkage attack doit être menée avant tout couplage, et le projet doit être soumis à un comité d'éthique ou à la CNIL selon sa nature.