Problema Capturilor de Ecran ale Metodologiei
Publicatiile academice si de cercetare au dezvoltat un model de documentare care creeaza un risc GDPR subestimat: capturi de ecran ale mediilor de analiza a datelor care arata date reale ca parte din demonstrarea metodologiei.
Scenarii comune:
- Un articol de invatare automata include o captura de ecran a unui DataFrame pandas care arata primele 10 randuri ale setului de date de antrenament — care contine inregistrari reale ale pacientilor
- Un articol de analiza a datelor clinice arata output R cu valorile pacientilor individuali intr-un tabel rezumat, cu ID-urile pacientilor partial vizibile
- Un tutorial de inginerie a datelor publicat intr-o revista de cercetare include capturi de ecran ale notebook-ului Jupyter cu inregistrari reale ale utilizatorilor folosite ca 'date de exemplu'
In fiecare caz, autorul nu a intentionat sa publice date personale. Captura de ecran a fost inclusa pentru a documenta metodologia. Datele personale din captura de ecran sunt incidentale.
Dar 'incidental' nu inseamna conform. GDPR Articolul 4(1) defineste datele personale ca 'orice informatie referitoare la o persoana fizica identificata sau identificabila'.
Fluxul de Lucru de Examinare a Manuscriselor inainte de Trimitere
- Identificati toate imaginile din manuscript: Capturi de ecran, figuri, grafice cu etichete de date
- Procesati imaginile prin detectia OCR + PII: Convertiti imaginile in text si examinati pentru PII
- Curatati sau inlocuiti datele: Utilizati date sintetice sau anonimizate in exemplele de metodologie
- Documentati curatarea datelor: Pastrati dovezi ale procesului de anonimizare
Surse: Orientarile CNIL privind Cercetarea Stiintifica si GDPR 2024; Standardele de Publicare a Datelor EDPB; Ghidurile Etice COPE (Committee on Publication Ethics)