Masalah Tangkapan Layar Metodologi
Publikasi akademis dan penelitian telah mengembangkan pola dokumentasi yang menciptakan risiko GDPR yang kurang diapresiasi: tangkapan layar lingkungan analisis data yang menampilkan data nyata sebagai bagian dari demonstrasi metodologi.
Skenarionya umum terjadi:
- Makalah machine learning menyertakan tangkapan layar DataFrame pandas yang menampilkan 10 baris pertama dataset pelatihan — yang berisi catatan pasien nyata dari sumber data
- Makalah analisis data klinis menampilkan output R dengan nilai pasien individual dalam tabel ringkasan, dengan ID pasien yang sebagian terlihat
- Makalah ilmu sosial komputasional menyertakan tabel output SPSS yang menampilkan nilai responden survei individual sebagai bagian dari penjelasan prosedur analisis
- Tutorial rekayasa data yang diterbitkan dalam jurnal penelitian menyertakan tangkapan layar Jupyter notebook dengan catatan pengguna nyata yang digunakan sebagai "data sampel" untuk ilustrasi
Dalam setiap kasus, penulis tidak bermaksud menerbitkan data pribadi. Tangkapan layar disertakan untuk mendokumentasikan metodologi. Data pribadi dalam tangkapan layar bersifat insidental — ada untuk membuat contoh konkret.
Namun "insidental" tidak membuatnya patuh. Pasal 4(1) GDPR mendefinisikan data pribadi sebagai informasi apa pun yang berkaitan dengan orang alami yang teridentifikasi atau dapat diidentifikasi. Catatan pasien dalam makalah yang diterbitkan — bahkan sebagai tangkapan layar — adalah data pribadi. Menerbitkannya tanpa persetujuan pasien atau dasar hukum lain berdasarkan Pasal 6 merupakan pelanggaran GDPR.
Mengapa Ini Menciptakan Risiko Hukum yang Nyata
Lembaga penelitian semakin menghadapi penegakan GDPR untuk kegagalan publikasi data. Perkembangan utama:
Permintaan penarikan jurnal: Hak hapus GDPR (Pasal 17) berlaku untuk data yang diterbitkan. Jika subjek data menemukan data pribadi mereka dalam makalah yang diterbitkan, mereka dapat meminta penghapusan — yang untuk artikel jurnal biasanya berarti penarikan atau pemberitahuan koreksi. Penarikan jurnal adalah konsekuensi profesional yang signifikan.
Temuan komite etika penelitian: Komite etika penelitian yang meninjau penelitian yang diterbitkan untuk kepatuhan GDPR telah mulai mengeluarkan temuan untuk makalah yang menyertakan data tingkat individual dalam tangkapan layar tanpa pengamanan yang tepat. Temuan-temuan ini mempengaruhi posisi peneliti dengan komite etika untuk penelitian di masa depan.
Pelanggaran Perjanjian Akses Data: Sebagian besar dataset penelitian dibagikan di bawah Perjanjian Akses Data yang menentukan bagaimana data dapat digunakan dan apa yang dapat diterbitkan. Menyertakan data tingkat individual dalam tangkapan layar publikasi, bahkan sebagai thumbnail, dapat melanggar DAA — dengan konsekuensi termasuk hilangnya hak akses data.
Keterbatasan pengecualian penelitian Pasal 89 GDPR: Pasal 89 GDPR mengizinkan pemrosesan data pribadi untuk penelitian ilmiah dengan kewajiban yang berkurang — tetapi hanya di mana "pengamanan yang tepat" diterapkan. Menerbitkan data tingkat individual dalam tangkapan layar metodologi tanpa anonimisasi bukanlah pengamanan yang tepat; itu adalah pengungkapan.
Skala Masalah
Kejadiannya tidak jarang. Tinjauan sistematis makalah ilmu data yang diterbitkan dalam jurnal berdampak tinggi antara 2022-2024 kemungkinan akan menemukan proporsi yang signifikan yang berisi gambar dengan data tingkat individual yang terlihat.
Faktor yang berkontribusi:
Norma reproduktibilitas: Penerbitan ilmiah modern semakin mensyaratkan bahwa metode didokumentasikan dengan detail yang cukup untuk mereproduksi hasil. Tangkapan layar lingkungan analisis dianggap memenuhi norma ini.
Kecepatan publikasi: Di bawah tekanan tenggat waktu, peneliti menghasilkan tangkapan layar dengan cepat tanpa meninjau setiap gambar untuk konten data.
Visibilitas data yang rendah dalam gambar: Tangkapan layar DataFrame dengan 20 kolom dan 5 baris mungkin memiliki nama dan ID di kolom periferal yang tidak difokuskan peneliti saat mendokumentasikan prosedur analisis.
Tidak ada pemeriksaan otomatis dalam alur kerja pengiriman: Portal pengiriman jurnal standar melakukan pemeriksaan kelengkapan, pemeriksaan format, dan penyaringan plagiarisme. Tidak ada yang melakukan deteksi PII gambar.
Implementasi Penyaringan untuk Kelompok Penelitian
Alur kerja praktis untuk kelompok penelitian yang menerapkan penyaringan PII naskah:
Protokol pra-pengiriman:
- Peneliti menyelesaikan draf naskah dengan semua gambar
- Draf diserahkan ke penyaringan internal (PI atau peninjau yang ditunjuk)
- Deteksi PII gambar dijalankan pada semua file gambar yang dilampirkan ke naskah
- Laporan deteksi mengidentifikasi: gambar mana yang berisi teks yang dapat dibaca, teks mana yang cocok dengan pola entitas PII
- Peneliti meninjau gambar yang ditandai
- Untuk setiap gambar yang ditandai: ganti dengan tangkapan layar yang benar-benar dianonimkan (ganti ID pasien 12847 dengan ID 00001, ganti nama nyata dengan "Pasien A")
- Naskah akhir diserahkan ke jurnal dengan tangkapan layar yang dianonimkan
Opsi integrasi teknis:
- Manual: ekspor semua gambar naskah, jalankan deteksi PII gambar batch, tinjau laporan
- Semi-otomatis: folder khusus tempat naskah draf disimpan; pemrosesan batch mingguan berjalan pada file baru
- Terintegrasi alur kerja: portal pengiriman institusional dengan langkah penyaringan pra-pengiriman
Biaya waktu penyaringan rendah: untuk naskah 15 gambar yang tipikal, deteksi PII gambar membutuhkan waktu kurang dari 2 menit. Biaya waktu penarikan atau temuan komite etika diukur dalam bulan.
Studi Kasus: Persyaratan Etika Penelitian Universitas Eropa
Kelompok penelitian ilmu data di universitas Eropa menerapkan penyaringan PII gambar sebagai bagian dari alur kerja pengiriman naskah mereka setelah hampir celaka: tinjauan makalah yang diajukan mendeteksi nama pasien individual dalam tangkapan layar DataFrame yang disertakan sebagai ilustrasi metodologi.
Implementasi:
- Semua draf makalah diproses untuk PII gambar sebelum pengiriman ke jurnal
- Penyaringan mencakup semua gambar PNG, JPG, dan PDF dalam draf
- Hasil ditinjau oleh kontak privasi data yang ditunjuk kelompok
Hasil selama 6 bulan:
- 23 naskah disaring sebelum pengiriman
- 7 naskah (30%) memiliki setidaknya satu gambar dengan entitas PII yang dapat dideteksi
- Jenis entitas yang ditemukan: nama pasien dalam DataFrame (4 makalah), ID pengguna yang cocok dengan format pendaftaran pasien (2 makalah), alamat email di margin tangkapan layar (1 makalah)
- Semua 7 dikoreksi sebelum pengiriman
- Nol permintaan penarikan pasca-pengiriman atau temuan etika selama periode tersebut
Komite etika penelitian institusi kini menggunakan alur kerja ini sebagai contoh terdokumentasi dari "pengamanan yang tepat" dalam aplikasi pengecualian penelitian Pasal 89 GDPR.
Sumber: