อัปเดตสำหรับปี 2026 — การบังคับใช้ GDPR ต่อกลุ่มวิจัยเพิ่มขึ้น ความเสี่ยงนี้ยังคงพบบ่อยในงานที่ตีพิมพ์
ปัญหาภาพหน้าจอของวิธีการ
บทความวิชาการหลายฉบับรวมภาพหน้าจอของเครื่องมือวิเคราะห์ เป้าหมายคือการแสดงวิธีการ แต่ภาพหน้าจอเหล่านั้นอาจเปิดเผยบันทึกส่วนบุคคลจริง นักวิจัยส่วนใหญ่ไม่สังเกตเห็นความเสี่ยงนี้
นี่คือสี่กรณีที่พบบ่อย:
- บทความ Machine Learning แสดง pandas DataFrame แถวแรก 10 แถวมีชื่อและ ID ผู้ป่วยจริง
- การศึกษาทางคลินิกแสดงผลลัพธ์ R ค่าผู้ป่วยอยู่บนหน้าจอ ID ผู้ป่วยปรากฏที่ขอบ
- บทความสังคมศาสตร์แสดงตาราง SPSS การตอบกลับแบบสำรวจจากคนจริงมองเห็นได้
- บทช่วยสอนวารสารแสดง Jupyter Notebook บันทึกผู้ใช้จริงเป็นแถวตัวอย่าง
ในแต่ละกรณี ผู้เขียนตั้งใจแสดงวิธีการ บันทึกส่วนบุคคลไม่ใช่จุดประสงค์ แต่มีอยู่ที่นั่นเพื่อทำให้ตัวอย่างดูสมจริง
แต่ "ไม่ใช่จุดประสงค์" ไม่ได้หมายความว่าปลอดภัย GDPR Article 4(1) ระบุว่าบันทึกส่วนบุคคลรวมถึงข้อเท็จจริงใดๆ เกี่ยวกับบุคคลที่ระบุตัวตนได้ บันทึกผู้ป่วยในบทความที่ตีพิมพ์เป็นข้อมูลส่วนบุคคล ไม่สำคัญว่าจะอยู่ในภาพหน้าจอ การตีพิมพ์โดยไม่มีความยินยอมหรือฐานทางกฎหมายภายใต้ Article 6 ถือเป็นการละเมิด GDPR
ดู ภาพรวมการปฏิบัติตาม GDPR สำหรับข้อมูลเพิ่มเติมเกี่ยวกับกฎการตีพิมพ์
ทำไมสิ่งนี้จึงสร้างความเสี่ยงทางกฎหมาย
กลุ่มวิจัยเผชิญกับการบังคับใช้ GDPR มากขึ้น ความล้มเหลวในการตีพิมพ์เป็นตัวกระตุ้นหลัก มีความเสี่ยงสี่ประการที่โดดเด่น
การถอนบทความจากวารสาร Article 17 ให้สิทธิ์ผู้คนในการลบข้อมูล ใช้กับบันทึกที่ตีพิมพ์ด้วย หากบุคคลพบรายละเอียดของตนในบทความ พวกเขาสามารถขอให้ลบ สำหรับวารสาร มักหมายถึงการถอน การถอนทำร้ายอาชีพของนักวิจัย
การค้นพบของคณะกรรมการจริยธรรม คณะกรรมการจริยธรรมตรวจสอบงานที่ตีพิมพ์ ตรวจสอบการสอดคล้องกับ GDPR พวกเขาเริ่มระบุบทความที่แสดงบันทึกส่วนบุคคลในภาพหน้าจอ การระบุดังกล่าวส่งผลต่องานในอนาคตของนักวิจัย
การละเมิดข้อตกลงการเข้าถึงข้อมูล ชุดข้อมูลวิจัยมาพร้อมกับข้อตกลงการเข้าถึงข้อมูล กฎเหล่านี้ระบุสิ่งที่อาจตีพิมพ์ได้ ภาพหน้าจอที่มีบันทึกส่วนบุคคลอาจละเมิดข้อตกลง ผลลัพธ์มักคือการสูญเสียการเข้าถึงชุดข้อมูล
ข้อจำกัด Article 89 Article 89 อนุญาตให้ใช้ข้อมูลส่วนบุคคลเพื่อวิทยาศาสตร์ ผ่อนคลายกฎบางข้อ แต่เฉพาะเมื่อมีมาตรการป้องกันที่เหมาะสม การแสดงบันทึกส่วนบุคคลในภาพหน้าจอโดยไม่ลดการระบุตัวตนไม่ใช่มาตรการป้องกัน แต่เป็นการละเมิด
เกิดขึ้นบ่อยแค่ไหน?
ปัญหานี้ไม่ใช่เรื่องหายาก ส่งผลกระทบต่องานที่ตีพิมพ์ในหลายสาขา
ปัจจัยหลายประการผลักดันให้เกิดขึ้น
บรรทัดฐานความสามารถในการทำซ้ำ วารสารต้องการรายละเอียดวิธีการ นักวิจัยใช้ภาพหน้าจอเพื่อตอบสนองความต้องการนี้ โดยไม่ตรวจสอบเสมอว่ามีอะไรปรากฏในแต่ละรูปภาพ
กำหนดเวลาที่ตึงเครียด แรงกดดันด้านเวลานำไปสู่ภาพหน้าจอที่รวดเร็ว ไม่มีเวลาตรวจสอบแต่ละรูปภาพสำหรับบันทึกที่เปิดเผย
การมองเห็นต่ำในรูปภาพ DataFrame อาจมี 20 คอลัมน์ ชื่อและ ID อาจอยู่ในคอลัมน์ทางขวา นักวิจัยมองที่คอลัมน์หลัก ไม่ใช่คอลัมน์ ID
ไม่มีการตรวจสอบเมื่อส่ง พอร์ทัลวารสารรันการตรวจสอบรูปแบบและการตรวจจับการลอกเลียน ไม่มีใครตรวจสอบรูปภาพสำหรับเอนทิตีส่วนบุคคล ไม่มีสิ่งใดแจ้งปัญหาก่อนบทความออนไลน์
ขั้นตอนการทำงานการตรวจสอบสำหรับกลุ่มวิจัย
กระบวนการตรวจสอบก่อนส่งสามารถหยุดปัญหาเหล่านี้ได้ มีเจ็ดขั้นตอน
- นักวิจัยเสร็จสิ้นร่างต้นฉบับพร้อมรูปภาพทั้งหมด
- ร่างไปยังผู้ตรวจสอบภายใน — PI หรือผู้ติดต่อด้านความเป็นส่วนตัว
- การตรวจหาข้อมูลส่วนบุคคลรูปภาพรันบนไฟล์รูปภาพทั้งหมดในต้นฉบับ
- รายงานระบุรูปภาพที่มีข้อความที่อ่านได้ซึ่งตรงกับรูปแบบเอนทิตีส่วนบุคคล
- นักวิจัยตรวจสอบรูปภาพที่ถูกระบุ
- สำหรับแต่ละรูปภาพที่ถูกระบุ: แทนที่ด้วยภาพหน้าจอสะอาด สลับ ID ผู้ป่วย 12847 ด้วย ID 00001 แทนที่ชื่อจริงด้วย "ผู้ป่วย A"
- ต้นฉบับสุดท้ายไปยังวารสารพร้อมรูปภาพสะอาด
ตัวเลือกทางเทคนิค:
- ด้วยตนเอง: ส่งออกรูปภาพต้นฉบับ รันการตรวจหาข้อมูลส่วนบุคคลแบบแบตช์ ตรวจสอบรายงาน
- กึ่งอัตโนมัติ: ใช้โฟลเดอร์ร่วมกันสำหรับร่าง รันการประมวลผลแบตช์แต่ละสัปดาห์บนไฟล์ใหม่
- รวมเข้ากับขั้นตอนการทำงาน: เพิ่มขั้นตอนการตรวจสอบในพอร์ทัลส่ง
การตรวจสอบรวดเร็ว สำหรับต้นฉบับที่มี 15 รูปภาพ การตรวจหาข้อมูลส่วนบุคคลรูปภาพใช้เวลาไม่ถึงสองนาที การถอนใช้เวลาหลายเดือน
กรณีศึกษา: มหาวิทยาลัยยุโรป
กลุ่มวิจัยหนึ่งเพิ่มการตรวจสอบข้อมูลส่วนบุคคลรูปภาพในขั้นตอนการทำงานต้นฉบับ เหตุการณ์เกือบพลาดกระตุ้นการเปลี่ยนแปลง บทความที่อยู่ระหว่างการตรวจสอบมีชื่อผู้ป่วยในภาพหน้าจอ DataFrame
สิ่งที่พวกเขาทำ:
- บทความร่างทั้งหมดผ่านการตรวจสอบข้อมูลส่วนบุคคลรูปภาพก่อนส่งวารสาร
- การตรวจสอบครอบคลุมรูปภาพ PNG, JPG และ PDF ทั้งหมดในแต่ละร่าง
- ผู้ติดต่อด้านความเป็นส่วนตัวตรวจสอบผลลัพธ์
ผลลัพธ์ในช่วงหกเดือน:
- ตรวจสอบต้นฉบับ 23 ฉบับ
- ต้นฉบับ 7 ฉบับ (30%) มีรูปภาพอย่างน้อยหนึ่งภาพที่มีเอนทิตีส่วนบุคคล
- ประเภทที่พบ: ชื่อผู้ป่วยใน DataFrames (4 บทความ)
- ID ผู้ใช้ที่ตรงกับรูปแบบผู้ป่วย (2 บทความ)
- ที่อยู่อีเมลในขอบภาพหน้าจอ (1 บทความ)
- แก้ไขทั้ง 7 ฉบับก่อนส่ง
- ไม่มีคำขอถอนหรือการค้นพบด้านจริยธรรมหลังส่ง
คณะกรรมการจริยธรรมอ้างถึงขั้นตอนการทำงานนี้ว่าเป็น "มาตรการป้องกันที่เหมาะสม" ตัวอย่างภายใต้ Article 89 สนับสนุนการสมัครการยกเว้นการวิจัยของกลุ่มในอนาคต