بروزرسانی برای ۲۰۲۶ — اجرای GDPR علیه گروههای پژوهشی افزایش یافته است. این ریسک در کارهای منتشرشده رایج است.
مشکل اسکرینشات روششناسی
بسیاری از مقالات علمی شامل اسکرینشاتهای ابزارهای تحلیل هستند. هدف نشان دادن روش است. اما آن اسکرینشاتها میتوانند سوابق شخصی واقعی را آشکار کنند. اکثر پژوهشگران این ریسک را متوجه نمیشوند.
چهار مورد رایج:
- یک مقاله یادگیری ماشین یک DataFrame pandas نشان میدهد. ۱۰ ردیف اول دارای نام و شناسه واقعی بیمار است.
- یک مطالعه بالینی خروجی R را نشان میدهد. مقادیر بیمار روی صفحه است. شناسههای بیمار در حاشیه نمایش دارند.
- یک مقاله علوم اجتماعی جداول SPSS را نشان میدهد. پاسخهای نظرسنجی از افراد واقعی قابل مشاهده است.
- یک آموزش مجله یک دفترچه Jupyter نشان میدهد. سوابق کاربری واقعی به عنوان ردیفهای نمونه استفاده میشود.
در هر مورد، نویسنده قصد داشت روش را نشان دهد. سوابق شخصی هدف نبودند. آنها فقط برای واقعیتر جلوه دادن مثال حضور داشتند.
اما «هدف نبودن» به معنای امنیت نیست. ماده ۴(۱) GDPR میگوید اطلاعات شخصی شامل هر واقعیتی درباره یک فرد شناساییشده میشود. سابقه بیمار در یک مقاله منتشرشده اطلاعات شخصی است. مهم نیست که در اسکرینشات باشد. انتشار آن بدون رضایت یا مبنای قانونی تحت ماده ۶ GDPR را نقض میکند.
نمای کلی انطباق GDPR را برای اطلاعات بیشتر درباره قوانین انتشار ببینید.
چرا این ریسک قانونی ایجاد میکند
گروههای پژوهشی اکنون با اجرای بیشتر GDPR مواجه هستند. شکستهای انتشار یک محرک کلیدی هستند. چهار ریسک برجسته است.
پسگیری مجله. ماده ۱۷ به افراد حق پاکسازی میدهد. این برای سوابق منتشرشده هم اعمال میشود. اگر شخصی جزئیات خود را در یک مقاله پیدا کند، میتواند درخواست حذف کند. برای یک مجله، این اغلب به معنای پسگیری است. پسگیری به حرفه یک پژوهشگر آسیب میرساند.
یافتههای کمیته اخلاق. کمیتههای اخلاق کارهای منتشرشده را بررسی میکنند. همراستایی GDPR را بررسی میکنند. شروع کردهاند به علامتگذاری مقالاتی که سوابق شخصی در اسکرینشاتها نشان میدهند. این علامتها بر کارهای آینده پژوهشگر تأثیر میگذارند.
نقض توافقنامههای دسترسی به داده. مجموعه دادههای پژوهشی با توافقنامههای دسترسی به داده ارائه میشوند. این قوانین بیان میکنند چه چیزی ممکن است منتشر شود. یک اسکرینشات با سوابق شخصی میتواند توافقنامه را نقض کند.
محدودیتهای ماده ۸۹. ماده ۸۹ استفاده از اطلاعات شخصی برای علم را مجاز میداند. برخی قوانین را کاهش میدهد. اما فقط جایی که حفاظهای مناسب وجود دارد. نشان دادن سوابق شخصی در یک اسکرینشات بدون حذف شناسه یک حفاظ نیست. یک نقض است.
چند بار این اتفاق میافتد؟
این مشکل نادر نیست. در کارهای منتشرشده در بسیاری از زمینهها تأثیر میگذارد.
چند عامل آن را هدایت میکند.
هنجارهای تکرارپذیری. مجلات جزئیات روش میخواهند. پژوهشگران از اسکرینشات برای پاسخ به این نیاز استفاده میکنند. همیشه بررسی نمیکنند چه چیزی در هر تصویر قابل مشاهده است.
موعدهای تنگ. فشار زمانی به اسکرینشاتهای سریع منجر میشود. وقتی برای بررسی هر تصویر برای سوابق مواجه وجود ندارد.
دید کم در تصاویر. یک DataFrame میتواند ۲۰ ستون داشته باشد. نامها و شناسهها ممکن است در ستونهای دور سمت راست باشند. پژوهشگر به ستون کلیدی نگاه میکند، نه ستون شناسه.
بدون بررسی در ارسال. پورتالهای مجله بررسیهای قالب و اسکن سرقت ادبی اجرا میکنند. هیچکدام تصاویر را برای موجودیتهای شخصی بررسی نمیکنند.
جریان کاری غربالگری برای گروههای پژوهشی
یک فرآیند غربالگری پیش از ارسال میتواند این مشکلات را متوقف کند. هفت مرحله دارد.
- پژوهشگر پیشنویس دستنوشته را با تمام شکلها کامل میکند.
- پیشنویس به یک بازبین داخلی میرود — PI یا یک مخاطب حریم خصوصی.
- شناسایی اطلاعات شخصی تصویر بر روی تمام فایلهای تصویری در دستنوشته اجرا میشود.
- گزارش تصاویر دارای متن قابل خواندن که با الگوهای موجودیت شخصی مطابقت دارد را علامت میزند.
- پژوهشگر تصاویر علامتگذاریشده را بررسی میکند.
- برای هر تصویر علامتگذاریشده: با یک اسکرینشات تمیز جایگزین کنید. شناسه بیمار ۱۲۸۴۷ را با شناسه ۰۰۰۰۱ عوض کنید. نامهای واقعی را با «بیمار الف» جایگزین کنید.
- دستنوشته نهایی با تصاویر تمیز به مجله ارسال میشود.
گزینههای فنی:
- دستی: تصاویر دستنوشته را صادر کنید. شناسایی اطلاعات شخصی دستهای را اجرا کنید. گزارش را بررسی کنید.
- نیمهخودکار: از یک پوشه مشترک برای پیشنویسها استفاده کنید. پردازش دستهای را هر هفته بر روی فایلهای جدید اجرا کنید.
- یکپارچه با جریان کاری: یک مرحله غربالگری به پورتال ارسال اضافه کنید.
غربالگری سریع است. برای یک دستنوشته ۱۵ شکلی، شناسایی اطلاعات شخصی تصویر زیر دو دقیقه طول میکشد. یک پسگیری ماهها طول میکشد.
پرسشهای متداول یا واژهنامه را برای اطلاعات بیشتر درباره ویژگیهای شناسایی ببینید.
مطالعه موردی: یک دانشگاه اروپایی
یک گروه پژوهشی غربالگری اطلاعات شخصی تصویر را به جریان کاری دستنوشته خود اضافه کرد. یک حادثه نزدیک این تغییر را آغاز کرد. یک مقاله در حال بررسی نام بیماران در یک اسکرینشات DataFrame داشت.
اقدامات آنها:
- تمام مقالات پیشنویس قبل از ارسال به مجله برای اطلاعات شخصی تصویر پردازش شدند.
- غربالگری تمام شکلهای PNG، JPG و PDF را در هر پیشنویس پوشش داد.
- یک مخاطب حریم خصوصی نتایج را بررسی کرد.
نتایج در شش ماه:
- ۲۳ دستنوشته غربالگری شد.
- ۷ دستنوشته (۳۰٪) حداقل یک تصویر با موجودیتهای شخصی داشتند.
- انواع یافتشده: نام بیماران در DataFrameها (۴ مقاله)، شناسههای کاربری منطبق با قالبهای بیمار (۲ مقاله)، آدرسهای ایمیل در حاشیه اسکرینشات (۱ مقاله).
- همه ۷ قبل از ارسال اصلاح شدند.
- صفر درخواست پسگیری یا یافتههای اخلاقی پس از ارسال.
کمیته اخلاق اکنون این جریان کاری را به عنوان یک «حفاظ مناسب» تحت ماده ۸۹ ذکر میکند.