Обновлено в 2026 году — Правоприменение GDPR в отношении исследовательских организаций усилилось. Этот риск по-прежнему широко распространён в публикуемых работах.

Проблема методологических скриншотов

Многие академические статьи содержат снимки экрана с инструментами анализа. Цель — показать методику. Но такие скриншоты могут раскрывать реальные персональные записи. Большинство исследователей не замечают этого риска.

Вот четыре распространённых случая:

В статье о машинном обучении показан датафрейм pandas. В первых 10 строках — реальные имена и идентификаторы пациентов.
В клиническом исследовании показан вывод R. Значения пациентов видны на экране. Идентификаторы пациентов отображаются на полях.
В статье по социальным наукам показаны таблицы SPSS. Видны ответы реальных людей на опросы.
В обучающем материале журнала показана записная книжка Jupyter. Реальные пользовательские записи служат примерами строк.

В каждом случае автор намеревался показать методологию. Персональные записи не были главным. Они просто делали пример более реалистичным.

Но «не главное» не означает безопасное. Статья 4(1) GDPR гласит, что персональные данные включают любые сведения об идентифицированном лице. Запись пациента в опубликованной статье является персональной информацией. Не важно, находится ли она на скриншоте. Её публикация без согласия или правового основания по Статье 6 нарушает GDPR.

Подробнее о правилах публикации — в обзоре соответствия GDPR.

Почему это создаёт правовой риск

Исследовательские организации всё чаще сталкиваются с правоприменением GDPR. Нарушения при публикации — один из ключевых триггеров. Выделяются четыре риска.

Отзыв из журнала. Статья 17 даёт людям право на удаление данных. Это распространяется и на опубликованные записи. Если человек обнаружит свои данные в статье, он может потребовать их удаления. Для журнала это часто означает отзыв публикации. Отзыв наносит серьёзный урон карьере исследователя.

Выводы этических комитетов. Этические комитеты проверяют опубликованные работы. Они проверяют соответствие GDPR. Они начали помечать статьи, показывающие персональные данные на скриншотах. Такие пометки влияют на будущие работы исследователя.

Нарушения соглашений о доступе к данным. Исследовательские наборы данных предоставляются с Соглашениями о доступе к данным. В них прописано, что можно публиковать. Скриншот с персональными данными может нарушить соглашение. Результатом часто является потеря доступа к набору данных.

Ограничения Статьи 89. Статья 89 разрешает использование персональных данных в научных целях. Она смягчает некоторые правила. Но только при наличии надлежащих защитных мер. Показ персональных данных на скриншоте без деидентификации не является защитной мерой. Это нарушение.

Полный анализ — на странице защиты данных и защитных мер.

Как часто это происходит?

Эта проблема не редкость. Она затрагивает публикации в самых разных областях.

Несколько факторов её обуславливают.

Нормы воспроизводимости. Журналы требуют детального описания методов. Исследователи используют скриншоты для выполнения этого требования. При этом они не всегда проверяют, что видно на каждом изображении.

Сжатые сроки. Цейтнот приводит к быстрым скриншотам. На проверку каждого изображения на предмет раскрытых данных времени не остаётся.

Низкая заметность в изображениях. Датафрейм может содержать 20 столбцов. Имена и идентификаторы могут находиться в крайнем правом столбце. Исследователь смотрит на ключевой столбец, а не на столбец с идентификатором.

Отсутствие проверки при подаче. Порталы журналов выполняют форматную проверку и проверку на плагиат. Ни один из них не проверяет изображения на наличие персональных сущностей. Ничто не сигнализирует о проблеме до выхода статьи в свет.

Рабочий процесс проверки для исследовательских групп

Процесс предварительной проверки перед подачей может предотвратить эти проблемы. Он состоит из семи шагов.

Исследователь завершает черновик рукописи со всеми рисунками.
Черновик передаётся внутреннему рецензенту — руководителю группы или контактному лицу по вопросам конфиденциальности.
Обнаружение персональных данных в изображениях запускается для всех графических файлов рукописи.
Отчёт помечает изображения с читаемым текстом, соответствующим шаблонам персональных сущностей.
Исследователь проверяет помеченные изображения.
Для каждого помеченного изображения: замените его чистым скриншотом. Замените идентификатор пациента 12847 на 00001. Замените реальные имена на «Пациент А».
Финальная рукопись подаётся в журнал с чистыми изображениями.

Технические варианты:

Ручной: Экспортируйте изображения рукописи. Запустите пакетное обнаружение персональных данных. Изучите отчёт.
Полуавтоматический: Используйте общую папку для черновиков. Запускайте пакетную обработку новых файлов еженедельно.
Интегрированный в рабочий процесс: Добавьте шаг проверки в портал подачи.

Проверка занимает немного времени. Для рукописи из 15 рисунков обнаружение персональных данных в изображениях занимает менее двух минут. Отзыв публикации — месяцы.

Подробности — в FAQ или глоссарии.

Практический случай: европейский университет

Одна исследовательская группа добавила проверку изображений на персональные данные в рабочий процесс подготовки рукописей. Изменение произошло после инцидента, едва не ставшего серьёзной проблемой. В рецензируемой статье обнаружились имена пациентов на скриншоте датафрейма.

Что они сделали:

Все черновики статей проверялись на наличие персональных данных в изображениях перед подачей в журнал.
Проверка охватывала все файлы PNG, JPG и PDF в каждом черновике.
Результаты анализировал контактный специалист по вопросам конфиденциальности.

Результаты за шесть месяцев:

Проверено 23 рукописи.
7 рукописей (30%) содержали хотя бы одно изображение с персональными данными.
Обнаруженные типы: имена пациентов в датафреймах (4 статьи).
Идентификаторы пользователей, соответствующие форматам пациентских ID (2 статьи).
Адреса электронной почты на полях скриншотов (1 статья).
Все 7 исправлены до подачи.
Ноль запросов на отзыв или выводов этических комитетов после подачи.

Этический комитет теперь называет этот рабочий процесс образцовой «надлежащей защитной мерой» по Статье 89. Он поддерживает будущие заявки группы на исследовательские исключения.

Прочитайте заявление основателя, чтобы узнать, почему anonym.legal был создан именно для таких проблем.

Источники

Связанные статьи

GDPR и соблюдение

Самостоятельный PII не проходит аудиты соответствия

spaCy 3.4.4 даёт результаты NER, отличающиеся от spaCy 3.5.1. Финансовая компания обнаружила, что 3% документов были анонимизированы по-разному в staging и продакшне.

GDPR и соблюдение

Presidio не охватывает 220+ сущностей GDPR

Presidio поставляется примерно с 40 распознавателями сущностей по умолчанию, ориентированными на американские идентификаторы. Европейским организациям нужны IBAN, Codice Fiscale и другие.

GDPR и соблюдение

Смещение конфигурации: скрытый риск для соответствия GDPR

Аналитик A заменяет имена псевдонимами. Аналитик B скрывает их. Ваш GDPR-аудит обнаруживает оба подхода в одном наборе данных. Смещение конфигурации — ситуация, когда в команде нет единства в настройках — создаёт аудиторские риски даже без утечки данных.

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.

Начать бесплатный пробный период Посмотреть функции

Персональные данные в научных публикациях: скриншоты и GDPR

Проблема методологических скриншотов

Почему это создаёт правовой риск

Как часто это происходит?

Рабочий процесс проверки для исследовательских групп

Практический случай: европейский университет

Источники

Связанные статьи

Самостоятельный PII не проходит аудиты соответствия

Presidio не охватывает 220+ сущностей GDPR

Смещение конфигурации: скрытый риск для соответствия GDPR

Готовы защитить ваши данные?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow