anonym.legal
Înapoi la BlogGDPR & Conformitate

PII in Publicatiile de Cercetare: De Ce Capturile de...

Articolele academice includ in mod regulat pandas DataFrame-uri si output R care arata inregistrari reale ale pacientilor ca exemple de metodologie.

April 21, 20267 min citire
research dataacademic GDPRpublication privacyOCR image detectionArticle 89

Problema Capturilor de Ecran ale Metodologiei

Publicatiile academice si de cercetare au dezvoltat un model de documentare care creeaza un risc GDPR subestimat: capturi de ecran ale mediilor de analiza a datelor care arata date reale ca parte din demonstrarea metodologiei.

Scenarii comune:

  • Un articol de invatare automata include o captura de ecran a unui DataFrame pandas care arata primele 10 randuri ale setului de date de antrenament — care contine inregistrari reale ale pacientilor
  • Un articol de analiza a datelor clinice arata output R cu valorile pacientilor individuali intr-un tabel rezumat, cu ID-urile pacientilor partial vizibile
  • Un tutorial de inginerie a datelor publicat intr-o revista de cercetare include capturi de ecran ale notebook-ului Jupyter cu inregistrari reale ale utilizatorilor folosite ca 'date de exemplu'

In fiecare caz, autorul nu a intentionat sa publice date personale. Captura de ecran a fost inclusa pentru a documenta metodologia. Datele personale din captura de ecran sunt incidentale.

Dar 'incidental' nu inseamna conform. GDPR Articolul 4(1) defineste datele personale ca 'orice informatie referitoare la o persoana fizica identificata sau identificabila'.

Fluxul de Lucru de Examinare a Manuscriselor inainte de Trimitere

  1. Identificati toate imaginile din manuscript: Capturi de ecran, figuri, grafice cu etichete de date
  2. Procesati imaginile prin detectia OCR + PII: Convertiti imaginile in text si examinati pentru PII
  3. Curatati sau inlocuiti datele: Utilizati date sintetice sau anonimizate in exemplele de metodologie
  4. Documentati curatarea datelor: Pastrati dovezi ale procesului de anonimizare

Surse: Orientarile CNIL privind Cercetarea Stiintifica si GDPR 2024; Standardele de Publicare a Datelor EDPB; Ghidurile Etice COPE (Committee on Publication Ethics)

Pregătit să vă protejați datele?

Începeți să anonimizati PII cu 285+ tipuri de entități în 48 de limbi.