2026년 업데이트 — 연구 기관에 대한 GDPR 집행이 증가했습니다. 이 위험은 출판된 연구에서 여전히 흔합니다.

방법론 스크린샷 문제

많은 학술 논문이 분석 도구의 스크린샷을 포함합니다. 목적은 방법을 보여주는 것입니다. 그러나 그 스크린샷에 실제 개인 기록이 드러날 수 있습니다. 대부분의 연구자는 이 위험을 인식하지 못합니다.

네 가지 일반적인 사례가 있습니다:

머신러닝 논문이 pandas DataFrame을 보여줍니다. 처음 10행에 실제 환자 이름과 ID가 있습니다.
임상 연구가 R 출력을 보여줍니다. 환자 값이 화면에 있습니다. 환자 ID가 여백에 표시됩니다.
사회 과학 논문이 SPSS 표를 보여줍니다. 실제 사람들의 설문 응답이 보입니다.
학술지 튜토리얼이 Jupyter 노트북을 보여줍니다. 실제 사용자 기록이 샘플 행으로 사용됩니다.

각 경우에 저자는 방법을 보여주려 했습니다. 개인 기록은 의도된 내용이 아니었습니다. 단지 예시를 실감 나게 만들기 위해 사용된 것이었습니다.

그러나 "의도하지 않았다"는 것이 안전하다는 의미가 아닙니다. GDPR 제4조 제1항은 개인 기록에 식별된 사람에 관한 모든 사실이 포함된다고 규정합니다. 출판된 논문의 환자 기록은 개인정보입니다. 스크린샷에 있어도 마찬가지입니다. 제6조에 따른 동의 또는 합법적인 근거 없이 이를 출판하는 것은 GDPR 위반입니다.

출판 규정에 대한 자세한 내용은 GDPR 준수 개요를 참조하십시오.

이것이 법적 위험을 만드는 이유

연구 기관은 이제 더 많은 GDPR 집행에 직면합니다. 출판 실패가 주요 원인입니다. 네 가지 위험이 두드러집니다.

학술지 게재 취소. 제17조는 삭제권을 부여합니다. 이는 출판된 기록에도 적용됩니다. 논문에서 자신의 정보를 발견한 사람은 제거를 요청할 수 있습니다. 학술지의 경우 이는 종종 게재 취소로 이어집니다. 게재 취소는 연구자의 경력에 타격을 줍니다.

윤리위원회 발견. 윤리위원회는 출판된 연구를 검토합니다. GDPR 준수 여부를 확인합니다. 스크린샷에 개인 기록이 표시된 논문에 플래그를 달기 시작했습니다. 이 플래그는 연구자의 향후 연구에 영향을 미칩니다.

데이터 접근 계약 위반. 연구 데이터 세트는 데이터 접근 계약과 함께 제공됩니다. 이 규칙은 무엇을 출판할 수 있는지를 명시합니다. 개인 기록이 담긴 스크린샷은 계약을 위반할 수 있습니다. 그 결과는 종종 데이터 세트 접근 권한 상실입니다.

제89조 한계. 제89조는 과학 목적으로 개인정보를 사용할 수 있게 합니다. 일부 규칙을 완화합니다. 그러나 적절한 보호 수단이 있는 경우에만 해당됩니다. 비식별화 없이 스크린샷에 개인 기록을 표시하는 것은 보호 수단이 아닙니다. 위반입니다.

전체 내용은 보호 및 안전장치 페이지를 참조하십시오.

이 문제가 얼마나 자주 발생하는가?

이 문제는 드물지 않습니다. 많은 분야의 출판된 연구에 영향을 미칩니다.

몇 가지 요인이 이를 유발합니다.

재현성 규범. 학술지는 방법 세부 사항을 원합니다. 연구자들은 이 요구를 충족하기 위해 스크린샷을 사용합니다. 각 이미지에서 무엇이 보이는지 항상 확인하지는 않습니다.

촉박한 마감. 시간 압박으로 빠른 스크린샷이 찍힙니다. 각 이미지에서 노출된 기록을 검토할 시간이 없습니다.

이미지 내 낮은 가시성. DataFrame은 20개의 열을 가질 수 있습니다. 이름과 ID는 오른쪽으로 멀리 있는 열에 있을 수 있습니다. 연구자는 ID 열이 아닌 핵심 열을 봅니다.

제출 시 검토 없음. 학술지 포털은 형식 검사와 표절 검사를 실행합니다. 개인 엔터티에 대해 이미지를 확인하는 것은 없습니다. 논문이 공개되기 전에 문제를 플래그 하는 것은 없습니다.

연구 그룹을 위한 스크리닝 워크플로

제출 전 스크리닝 프로세스가 이러한 문제를 방지할 수 있습니다. 7단계가 있습니다.

연구자가 모든 그림이 포함된 원고 초안을 완성합니다.
초안이 내부 검토자 — PI 또는 개인정보 담당자 — 에게 전달됩니다.
원고의 모든 이미지 파일에 이미지 PII 탐지가 실행됩니다.
보고서는 개인 엔터티 패턴과 일치하는 읽을 수 있는 텍스트가 포함된 이미지에 플래그를 답니다.
연구자가 플래그 된 이미지를 검토합니다.
각 플래그 된 이미지에 대해: 깨끗한 스크린샷으로 교체합니다. 환자 ID 12847을 ID 00001로 교체합니다. 실제 이름을 "환자 A"로 교체합니다.
최종 원고가 깨끗한 이미지와 함께 학술지에 제출됩니다.

기술적 옵션:

수동: 원고 이미지를 내보냅니다. 배치 PII 탐지를 실행합니다. 보고서를 검토합니다.
반자동: 초안을 위한 공유 폴더를 사용합니다. 새 파일에 대해 매주 배치 처리를 실행합니다.
워크플로 통합: 제출 포털에 스크리닝 단계를 추가합니다.

스크리닝은 빠릅니다. 그림 15개의 원고에 대한 이미지 PII 탐지는 2분 미만이 걸립니다. 게재 취소에는 몇 달이 걸립니다.

탐지 기능에 대한 자세한 내용은 FAQ 또는 용어 사전을 방문하십시오.

사례 연구: 유럽 대학

한 연구 그룹이 원고 워크플로에 이미지 PII 스크리닝을 추가했습니다. 위기일발의 상황이 변화를 촉발했습니다. 심사 중인 논문에 DataFrame 스크린샷에 환자 이름이 있었습니다.

수행한 조치:

모든 초안 논문이 학술지 제출 전에 이미지 PII 처리됨
스크리닝은 각 초안의 모든 PNG, JPG, PDF 그림을 포함
개인정보 담당자가 결과를 검토

6개월 동안의 결과:

23개 원고 스크리닝
7개 원고 (30%)에서 개인 엔터티가 있는 이미지 하나 이상 발견
발견 유형: DataFrame의 환자 이름 (논문 4편)
환자 형식과 일치하는 사용자 ID (논문 2편)
스크린샷 여백의 이메일 주소 (논문 1편)
7개 모두 제출 전에 수정됨
제출 후 게재 취소 요청이나 윤리 위반 발견 없음

윤리위원회는 이제 이 워크플로를 제89조에 따른 "적절한 보호 수단"의 모범 사례로 인용합니다. 이는 그룹의 향후 연구 면제 신청을 지원합니다.

anonym.legal이 이런 문제를 위해 구축된 이유를 알려면 창립자 성명을 읽어보십시오.

출처

데이터 보호를 시작할 준비가 되셨나요?

48개 언어로 285개 이상의 엔티티 유형으로 PII 익명화를 시작하세요.

무료 체험 시작 기능 보기

연구 출판물의 PII: 스크린샷과 GDPR

방법론 스크린샷 문제

이것이 법적 위험을 만드는 이유

이 문제가 얼마나 자주 발생하는가?

연구 그룹을 위한 스크리닝 워크플로

사례 연구: 유럽 대학

출처

관련 기사

자체 호스팅 PII 도구가 컴플라이언스 감사에서 실패하는 이유

Presidio가 GDPR 엔터티 220개 이상을 누락하는 이유

설정 드리프트: 숨겨진 GDPR 위험

데이터 보호를 시작할 준비가 되셨나요?

연구 출판물의 PII: 스크린샷과 GDPR

방법론 스크린샷 문제

이것이 법적 위험을 만드는 이유

이 문제가 얼마나 자주 발생하는가?

연구 그룹을 위한 스크리닝 워크플로

사례 연구: 유럽 대학

출처

관련 기사

자체 호스팅 PII 도구가 컴플라이언스 감사에서 실패하는 이유

Presidio가 GDPR 엔터티 220개 이상을 누락하는 이유

설정 드리프트: 숨겨진 GDPR 위험

데이터 보호를 시작할 준비가 되셨나요?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow