Masalah Tangkapan Layar Metodologi

Publikasi akademis dan penelitian telah mengembangkan pola dokumentasi yang menciptakan risiko GDPR yang kurang diapresiasi: tangkapan layar lingkungan analisis data yang menampilkan data nyata sebagai bagian dari demonstrasi metodologi.

Skenarionya umum terjadi:

Makalah machine learning menyertakan tangkapan layar DataFrame pandas yang menampilkan 10 baris pertama dataset pelatihan — yang berisi catatan pasien nyata dari sumber data
Makalah analisis data klinis menampilkan output R dengan nilai pasien individual dalam tabel ringkasan, dengan ID pasien yang sebagian terlihat
Makalah ilmu sosial komputasional menyertakan tabel output SPSS yang menampilkan nilai responden survei individual sebagai bagian dari penjelasan prosedur analisis
Tutorial rekayasa data yang diterbitkan dalam jurnal penelitian menyertakan tangkapan layar Jupyter notebook dengan catatan pengguna nyata yang digunakan sebagai "data sampel" untuk ilustrasi

Dalam setiap kasus, penulis tidak bermaksud menerbitkan data pribadi. Tangkapan layar disertakan untuk mendokumentasikan metodologi. Data pribadi dalam tangkapan layar bersifat insidental — ada untuk membuat contoh konkret.

Namun "insidental" tidak membuatnya patuh. Pasal 4(1) GDPR mendefinisikan data pribadi sebagai informasi apa pun yang berkaitan dengan orang alami yang teridentifikasi atau dapat diidentifikasi. Catatan pasien dalam makalah yang diterbitkan — bahkan sebagai tangkapan layar — adalah data pribadi. Menerbitkannya tanpa persetujuan pasien atau dasar hukum lain berdasarkan Pasal 6 merupakan pelanggaran GDPR.

Mengapa Ini Menciptakan Risiko Hukum yang Nyata

Lembaga penelitian semakin menghadapi penegakan GDPR untuk kegagalan publikasi data. Perkembangan utama:

Permintaan penarikan jurnal: Hak hapus GDPR (Pasal 17) berlaku untuk data yang diterbitkan. Jika subjek data menemukan data pribadi mereka dalam makalah yang diterbitkan, mereka dapat meminta penghapusan — yang untuk artikel jurnal biasanya berarti penarikan atau pemberitahuan koreksi. Penarikan jurnal adalah konsekuensi profesional yang signifikan.

Temuan komite etika penelitian: Komite etika penelitian yang meninjau penelitian yang diterbitkan untuk kepatuhan GDPR telah mulai mengeluarkan temuan untuk makalah yang menyertakan data tingkat individual dalam tangkapan layar tanpa pengamanan yang tepat. Temuan-temuan ini mempengaruhi posisi peneliti dengan komite etika untuk penelitian di masa depan.

Pelanggaran Perjanjian Akses Data: Sebagian besar dataset penelitian dibagikan di bawah Perjanjian Akses Data yang menentukan bagaimana data dapat digunakan dan apa yang dapat diterbitkan. Menyertakan data tingkat individual dalam tangkapan layar publikasi, bahkan sebagai thumbnail, dapat melanggar DAA — dengan konsekuensi termasuk hilangnya hak akses data.

Keterbatasan pengecualian penelitian Pasal 89 GDPR: Pasal 89 GDPR mengizinkan pemrosesan data pribadi untuk penelitian ilmiah dengan kewajiban yang berkurang — tetapi hanya di mana "pengamanan yang tepat" diterapkan. Menerbitkan data tingkat individual dalam tangkapan layar metodologi tanpa anonimisasi bukanlah pengamanan yang tepat; itu adalah pengungkapan.

Skala Masalah

Kejadiannya tidak jarang. Tinjauan sistematis makalah ilmu data yang diterbitkan dalam jurnal berdampak tinggi antara 2022-2024 kemungkinan akan menemukan proporsi yang signifikan yang berisi gambar dengan data tingkat individual yang terlihat.

Faktor yang berkontribusi:

Norma reproduktibilitas: Penerbitan ilmiah modern semakin mensyaratkan bahwa metode didokumentasikan dengan detail yang cukup untuk mereproduksi hasil. Tangkapan layar lingkungan analisis dianggap memenuhi norma ini.

Kecepatan publikasi: Di bawah tekanan tenggat waktu, peneliti menghasilkan tangkapan layar dengan cepat tanpa meninjau setiap gambar untuk konten data.

Visibilitas data yang rendah dalam gambar: Tangkapan layar DataFrame dengan 20 kolom dan 5 baris mungkin memiliki nama dan ID di kolom periferal yang tidak difokuskan peneliti saat mendokumentasikan prosedur analisis.

Tidak ada pemeriksaan otomatis dalam alur kerja pengiriman: Portal pengiriman jurnal standar melakukan pemeriksaan kelengkapan, pemeriksaan format, dan penyaringan plagiarisme. Tidak ada yang melakukan deteksi PII gambar.

Implementasi Penyaringan untuk Kelompok Penelitian

Alur kerja praktis untuk kelompok penelitian yang menerapkan penyaringan PII naskah:

Protokol pra-pengiriman:

Peneliti menyelesaikan draf naskah dengan semua gambar
Draf diserahkan ke penyaringan internal (PI atau peninjau yang ditunjuk)
Deteksi PII gambar dijalankan pada semua file gambar yang dilampirkan ke naskah
Laporan deteksi mengidentifikasi: gambar mana yang berisi teks yang dapat dibaca, teks mana yang cocok dengan pola entitas PII
Peneliti meninjau gambar yang ditandai
Untuk setiap gambar yang ditandai: ganti dengan tangkapan layar yang benar-benar dianonimkan (ganti ID pasien 12847 dengan ID 00001, ganti nama nyata dengan "Pasien A")
Naskah akhir diserahkan ke jurnal dengan tangkapan layar yang dianonimkan

Opsi integrasi teknis:

Manual: ekspor semua gambar naskah, jalankan deteksi PII gambar batch, tinjau laporan
Semi-otomatis: folder khusus tempat naskah draf disimpan; pemrosesan batch mingguan berjalan pada file baru
Terintegrasi alur kerja: portal pengiriman institusional dengan langkah penyaringan pra-pengiriman

Biaya waktu penyaringan rendah: untuk naskah 15 gambar yang tipikal, deteksi PII gambar membutuhkan waktu kurang dari 2 menit. Biaya waktu penarikan atau temuan komite etika diukur dalam bulan.

Studi Kasus: Persyaratan Etika Penelitian Universitas Eropa

Kelompok penelitian ilmu data di universitas Eropa menerapkan penyaringan PII gambar sebagai bagian dari alur kerja pengiriman naskah mereka setelah hampir celaka: tinjauan makalah yang diajukan mendeteksi nama pasien individual dalam tangkapan layar DataFrame yang disertakan sebagai ilustrasi metodologi.

Implementasi:

Semua draf makalah diproses untuk PII gambar sebelum pengiriman ke jurnal
Penyaringan mencakup semua gambar PNG, JPG, dan PDF dalam draf
Hasil ditinjau oleh kontak privasi data yang ditunjuk kelompok

Hasil selama 6 bulan:

23 naskah disaring sebelum pengiriman
7 naskah (30%) memiliki setidaknya satu gambar dengan entitas PII yang dapat dideteksi
Jenis entitas yang ditemukan: nama pasien dalam DataFrame (4 makalah), ID pengguna yang cocok dengan format pendaftaran pasien (2 makalah), alamat email di margin tangkapan layar (1 makalah)
Semua 7 dikoreksi sebelum pengiriman
Nol permintaan penarikan pasca-pengiriman atau temuan etika selama periode tersebut

Komite etika penelitian institusi kini menggunakan alur kerja ini sebagai contoh terdokumentasi dari "pengamanan yang tepat" dalam aplikasi pengecualian penelitian Pasal 89 GDPR.

Sumber:

Siap untuk melindungi data Anda?

Mulai anonimisasi PII dengan 285+ jenis entitas dalam 48 bahasa.

Mulai Uji Coba Gratis Lihat Fitur

PII Penelitian: Tangkapan Layar dan GDPR

Masalah Tangkapan Layar Metodologi

Mengapa Ini Menciptakan Risiko Hukum yang Nyata

Skala Masalah

Implementasi Penyaringan untuk Kelompok Penelitian

Studi Kasus: Persyaratan Etika Penelitian Universitas Eropa

Artikel Terkait

PII Self-Hosted Gagal Audit Kepatuhan

Presidio Melewatkan 220+ Entitas GDPR

Pergeseran Konfigurasi: Risiko GDPR yang Tersembunyi

Siap untuk melindungi data Anda?

PII Penelitian: Tangkapan Layar dan GDPR

Masalah Tangkapan Layar Metodologi

Mengapa Ini Menciptakan Risiko Hukum yang Nyata

Skala Masalah

Implementasi Penyaringan untuk Kelompok Penelitian

Studi Kasus: Persyaratan Etika Penelitian Universitas Eropa

Artikel Terkait

PII Self-Hosted Gagal Audit Kepatuhan

Presidio Melewatkan 220+ Entitas GDPR

Pergeseran Konfigurasi: Risiko GDPR yang Tersembunyi

Siap untuk melindungi data Anda?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow