By · Last updated 2026-06-05

Kembali ke BlogGDPR & Kepatuhan

PII Penelitian: Tangkapan Layar dan GDPR

Makalah akademis secara rutin menyertakan DataFrame pandas dan output R yang menampilkan catatan pasien nyata sebagai contoh metodologi. Inilah mengapa ini merupakan pelanggaran GDPR.

June 5, 20267 menit baca
research dataacademic GDPRpublication privacyOCR image detectionArticle 89

Masalah Tangkapan Layar Metodologi

Publikasi akademis dan penelitian telah mengembangkan pola dokumentasi yang menciptakan risiko GDPR yang kurang diapresiasi: tangkapan layar lingkungan analisis data yang menampilkan data nyata sebagai bagian dari demonstrasi metodologi.

Skenarionya umum terjadi:

  • Makalah machine learning menyertakan tangkapan layar DataFrame pandas yang menampilkan 10 baris pertama dataset pelatihan — yang berisi catatan pasien nyata dari sumber data
  • Makalah analisis data klinis menampilkan output R dengan nilai pasien individual dalam tabel ringkasan, dengan ID pasien yang sebagian terlihat
  • Makalah ilmu sosial komputasional menyertakan tabel output SPSS yang menampilkan nilai responden survei individual sebagai bagian dari penjelasan prosedur analisis
  • Tutorial rekayasa data yang diterbitkan dalam jurnal penelitian menyertakan tangkapan layar Jupyter notebook dengan catatan pengguna nyata yang digunakan sebagai "data sampel" untuk ilustrasi

Dalam setiap kasus, penulis tidak bermaksud menerbitkan data pribadi. Tangkapan layar disertakan untuk mendokumentasikan metodologi. Data pribadi dalam tangkapan layar bersifat insidental — ada untuk membuat contoh konkret.

Namun "insidental" tidak membuatnya patuh. Pasal 4(1) GDPR mendefinisikan data pribadi sebagai informasi apa pun yang berkaitan dengan orang alami yang teridentifikasi atau dapat diidentifikasi. Catatan pasien dalam makalah yang diterbitkan — bahkan sebagai tangkapan layar — adalah data pribadi. Menerbitkannya tanpa persetujuan pasien atau dasar hukum lain berdasarkan Pasal 6 merupakan pelanggaran GDPR.

Mengapa Ini Menciptakan Risiko Hukum yang Nyata

Lembaga penelitian semakin menghadapi penegakan GDPR untuk kegagalan publikasi data. Perkembangan utama:

Permintaan penarikan jurnal: Hak hapus GDPR (Pasal 17) berlaku untuk data yang diterbitkan. Jika subjek data menemukan data pribadi mereka dalam makalah yang diterbitkan, mereka dapat meminta penghapusan — yang untuk artikel jurnal biasanya berarti penarikan atau pemberitahuan koreksi. Penarikan jurnal adalah konsekuensi profesional yang signifikan.

Temuan komite etika penelitian: Komite etika penelitian yang meninjau penelitian yang diterbitkan untuk kepatuhan GDPR telah mulai mengeluarkan temuan untuk makalah yang menyertakan data tingkat individual dalam tangkapan layar tanpa pengamanan yang tepat. Temuan-temuan ini mempengaruhi posisi peneliti dengan komite etika untuk penelitian di masa depan.

Pelanggaran Perjanjian Akses Data: Sebagian besar dataset penelitian dibagikan di bawah Perjanjian Akses Data yang menentukan bagaimana data dapat digunakan dan apa yang dapat diterbitkan. Menyertakan data tingkat individual dalam tangkapan layar publikasi, bahkan sebagai thumbnail, dapat melanggar DAA — dengan konsekuensi termasuk hilangnya hak akses data.

Keterbatasan pengecualian penelitian Pasal 89 GDPR: Pasal 89 GDPR mengizinkan pemrosesan data pribadi untuk penelitian ilmiah dengan kewajiban yang berkurang — tetapi hanya di mana "pengamanan yang tepat" diterapkan. Menerbitkan data tingkat individual dalam tangkapan layar metodologi tanpa anonimisasi bukanlah pengamanan yang tepat; itu adalah pengungkapan.

Skala Masalah

Kejadiannya tidak jarang. Tinjauan sistematis makalah ilmu data yang diterbitkan dalam jurnal berdampak tinggi antara 2022-2024 kemungkinan akan menemukan proporsi yang signifikan yang berisi gambar dengan data tingkat individual yang terlihat.

Faktor yang berkontribusi:

Norma reproduktibilitas: Penerbitan ilmiah modern semakin mensyaratkan bahwa metode didokumentasikan dengan detail yang cukup untuk mereproduksi hasil. Tangkapan layar lingkungan analisis dianggap memenuhi norma ini.

Kecepatan publikasi: Di bawah tekanan tenggat waktu, peneliti menghasilkan tangkapan layar dengan cepat tanpa meninjau setiap gambar untuk konten data.

Visibilitas data yang rendah dalam gambar: Tangkapan layar DataFrame dengan 20 kolom dan 5 baris mungkin memiliki nama dan ID di kolom periferal yang tidak difokuskan peneliti saat mendokumentasikan prosedur analisis.

Tidak ada pemeriksaan otomatis dalam alur kerja pengiriman: Portal pengiriman jurnal standar melakukan pemeriksaan kelengkapan, pemeriksaan format, dan penyaringan plagiarisme. Tidak ada yang melakukan deteksi PII gambar.

Implementasi Penyaringan untuk Kelompok Penelitian

Alur kerja praktis untuk kelompok penelitian yang menerapkan penyaringan PII naskah:

Protokol pra-pengiriman:

  1. Peneliti menyelesaikan draf naskah dengan semua gambar
  2. Draf diserahkan ke penyaringan internal (PI atau peninjau yang ditunjuk)
  3. Deteksi PII gambar dijalankan pada semua file gambar yang dilampirkan ke naskah
  4. Laporan deteksi mengidentifikasi: gambar mana yang berisi teks yang dapat dibaca, teks mana yang cocok dengan pola entitas PII
  5. Peneliti meninjau gambar yang ditandai
  6. Untuk setiap gambar yang ditandai: ganti dengan tangkapan layar yang benar-benar dianonimkan (ganti ID pasien 12847 dengan ID 00001, ganti nama nyata dengan "Pasien A")
  7. Naskah akhir diserahkan ke jurnal dengan tangkapan layar yang dianonimkan

Opsi integrasi teknis:

  • Manual: ekspor semua gambar naskah, jalankan deteksi PII gambar batch, tinjau laporan
  • Semi-otomatis: folder khusus tempat naskah draf disimpan; pemrosesan batch mingguan berjalan pada file baru
  • Terintegrasi alur kerja: portal pengiriman institusional dengan langkah penyaringan pra-pengiriman

Biaya waktu penyaringan rendah: untuk naskah 15 gambar yang tipikal, deteksi PII gambar membutuhkan waktu kurang dari 2 menit. Biaya waktu penarikan atau temuan komite etika diukur dalam bulan.

Studi Kasus: Persyaratan Etika Penelitian Universitas Eropa

Kelompok penelitian ilmu data di universitas Eropa menerapkan penyaringan PII gambar sebagai bagian dari alur kerja pengiriman naskah mereka setelah hampir celaka: tinjauan makalah yang diajukan mendeteksi nama pasien individual dalam tangkapan layar DataFrame yang disertakan sebagai ilustrasi metodologi.

Implementasi:

  • Semua draf makalah diproses untuk PII gambar sebelum pengiriman ke jurnal
  • Penyaringan mencakup semua gambar PNG, JPG, dan PDF dalam draf
  • Hasil ditinjau oleh kontak privasi data yang ditunjuk kelompok

Hasil selama 6 bulan:

  • 23 naskah disaring sebelum pengiriman
  • 7 naskah (30%) memiliki setidaknya satu gambar dengan entitas PII yang dapat dideteksi
  • Jenis entitas yang ditemukan: nama pasien dalam DataFrame (4 makalah), ID pengguna yang cocok dengan format pendaftaran pasien (2 makalah), alamat email di margin tangkapan layar (1 makalah)
  • Semua 7 dikoreksi sebelum pengiriman
  • Nol permintaan penarikan pasca-pengiriman atau temuan etika selama periode tersebut

Komite etika penelitian institusi kini menggunakan alur kerja ini sebagai contoh terdokumentasi dari "pengamanan yang tepat" dalam aplikasi pengecualian penelitian Pasal 89 GDPR.

Sumber:

Siap untuk melindungi data Anda?

Mulai anonimisasi PII dengan 285+ jenis entitas dalam 48 bahasa.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.