By · Last updated 2026-06-05

블로그로 돌아가기GDPR 및 준수

연구 출판물의 PII: 스크린샷과 GDPR

학술 논문에는 방법론 예시로 실제 환자 기록이 담긴 pandas DataFrame과 R 출력이 정기적으로 포함됩니다. 이것이 GDPR 위반인 이유를 설명합니다.

June 5, 20267 분 읽기
research dataacademic GDPRpublication privacyOCR image detectionArticle 89

2026년 업데이트 — 연구 기관에 대한 GDPR 집행이 증가했습니다. 이 위험은 출판된 연구에서 여전히 흔합니다.

방법론 스크린샷 문제

많은 학술 논문이 분석 도구의 스크린샷을 포함합니다. 목적은 방법을 보여주는 것입니다. 그러나 그 스크린샷에 실제 개인 기록이 드러날 수 있습니다. 대부분의 연구자는 이 위험을 인식하지 못합니다.

네 가지 일반적인 사례가 있습니다:

  • 머신러닝 논문이 pandas DataFrame을 보여줍니다. 처음 10행에 실제 환자 이름과 ID가 있습니다.
  • 임상 연구가 R 출력을 보여줍니다. 환자 값이 화면에 있습니다. 환자 ID가 여백에 표시됩니다.
  • 사회 과학 논문이 SPSS 표를 보여줍니다. 실제 사람들의 설문 응답이 보입니다.
  • 학술지 튜토리얼이 Jupyter 노트북을 보여줍니다. 실제 사용자 기록이 샘플 행으로 사용됩니다.

각 경우에 저자는 방법을 보여주려 했습니다. 개인 기록은 의도된 내용이 아니었습니다. 단지 예시를 실감 나게 만들기 위해 사용된 것이었습니다.

그러나 "의도하지 않았다"는 것이 안전하다는 의미가 아닙니다. GDPR 제4조 제1항은 개인 기록에 식별된 사람에 관한 모든 사실이 포함된다고 규정합니다. 출판된 논문의 환자 기록은 개인정보입니다. 스크린샷에 있어도 마찬가지입니다. 제6조에 따른 동의 또는 합법적인 근거 없이 이를 출판하는 것은 GDPR 위반입니다.

출판 규정에 대한 자세한 내용은 GDPR 준수 개요를 참조하십시오.

이것이 법적 위험을 만드는 이유

연구 기관은 이제 더 많은 GDPR 집행에 직면합니다. 출판 실패가 주요 원인입니다. 네 가지 위험이 두드러집니다.

학술지 게재 취소. 제17조는 삭제권을 부여합니다. 이는 출판된 기록에도 적용됩니다. 논문에서 자신의 정보를 발견한 사람은 제거를 요청할 수 있습니다. 학술지의 경우 이는 종종 게재 취소로 이어집니다. 게재 취소는 연구자의 경력에 타격을 줍니다.

윤리위원회 발견. 윤리위원회는 출판된 연구를 검토합니다. GDPR 준수 여부를 확인합니다. 스크린샷에 개인 기록이 표시된 논문에 플래그를 달기 시작했습니다. 이 플래그는 연구자의 향후 연구에 영향을 미칩니다.

데이터 접근 계약 위반. 연구 데이터 세트는 데이터 접근 계약과 함께 제공됩니다. 이 규칙은 무엇을 출판할 수 있는지를 명시합니다. 개인 기록이 담긴 스크린샷은 계약을 위반할 수 있습니다. 그 결과는 종종 데이터 세트 접근 권한 상실입니다.

제89조 한계. 제89조는 과학 목적으로 개인정보를 사용할 수 있게 합니다. 일부 규칙을 완화합니다. 그러나 적절한 보호 수단이 있는 경우에만 해당됩니다. 비식별화 없이 스크린샷에 개인 기록을 표시하는 것은 보호 수단이 아닙니다. 위반입니다.

전체 내용은 보호 및 안전장치 페이지를 참조하십시오.

이 문제가 얼마나 자주 발생하는가?

이 문제는 드물지 않습니다. 많은 분야의 출판된 연구에 영향을 미칩니다.

몇 가지 요인이 이를 유발합니다.

재현성 규범. 학술지는 방법 세부 사항을 원합니다. 연구자들은 이 요구를 충족하기 위해 스크린샷을 사용합니다. 각 이미지에서 무엇이 보이는지 항상 확인하지는 않습니다.

촉박한 마감. 시간 압박으로 빠른 스크린샷이 찍힙니다. 각 이미지에서 노출된 기록을 검토할 시간이 없습니다.

이미지 내 낮은 가시성. DataFrame은 20개의 열을 가질 수 있습니다. 이름과 ID는 오른쪽으로 멀리 있는 열에 있을 수 있습니다. 연구자는 ID 열이 아닌 핵심 열을 봅니다.

제출 시 검토 없음. 학술지 포털은 형식 검사와 표절 검사를 실행합니다. 개인 엔터티에 대해 이미지를 확인하는 것은 없습니다. 논문이 공개되기 전에 문제를 플래그 하는 것은 없습니다.

연구 그룹을 위한 스크리닝 워크플로

제출 전 스크리닝 프로세스가 이러한 문제를 방지할 수 있습니다. 7단계가 있습니다.

  1. 연구자가 모든 그림이 포함된 원고 초안을 완성합니다.
  2. 초안이 내부 검토자 — PI 또는 개인정보 담당자 — 에게 전달됩니다.
  3. 원고의 모든 이미지 파일에 이미지 PII 탐지가 실행됩니다.
  4. 보고서는 개인 엔터티 패턴과 일치하는 읽을 수 있는 텍스트가 포함된 이미지에 플래그를 답니다.
  5. 연구자가 플래그 된 이미지를 검토합니다.
  6. 각 플래그 된 이미지에 대해: 깨끗한 스크린샷으로 교체합니다. 환자 ID 12847을 ID 00001로 교체합니다. 실제 이름을 "환자 A"로 교체합니다.
  7. 최종 원고가 깨끗한 이미지와 함께 학술지에 제출됩니다.

기술적 옵션:

  • 수동: 원고 이미지를 내보냅니다. 배치 PII 탐지를 실행합니다. 보고서를 검토합니다.
  • 반자동: 초안을 위한 공유 폴더를 사용합니다. 새 파일에 대해 매주 배치 처리를 실행합니다.
  • 워크플로 통합: 제출 포털에 스크리닝 단계를 추가합니다.

스크리닝은 빠릅니다. 그림 15개의 원고에 대한 이미지 PII 탐지는 2분 미만이 걸립니다. 게재 취소에는 몇 달이 걸립니다.

탐지 기능에 대한 자세한 내용은 FAQ 또는 용어 사전을 방문하십시오.

사례 연구: 유럽 대학

한 연구 그룹이 원고 워크플로에 이미지 PII 스크리닝을 추가했습니다. 위기일발의 상황이 변화를 촉발했습니다. 심사 중인 논문에 DataFrame 스크린샷에 환자 이름이 있었습니다.

수행한 조치:

  • 모든 초안 논문이 학술지 제출 전에 이미지 PII 처리됨
  • 스크리닝은 각 초안의 모든 PNG, JPG, PDF 그림을 포함
  • 개인정보 담당자가 결과를 검토

6개월 동안의 결과:

  • 23개 원고 스크리닝
  • 7개 원고 (30%)에서 개인 엔터티가 있는 이미지 하나 이상 발견
  • 발견 유형: DataFrame의 환자 이름 (논문 4편)
  • 환자 형식과 일치하는 사용자 ID (논문 2편)
  • 스크린샷 여백의 이메일 주소 (논문 1편)
  • 7개 모두 제출 전에 수정됨
  • 제출 후 게재 취소 요청이나 윤리 위반 발견 없음

윤리위원회는 이제 이 워크플로를 제89조에 따른 "적절한 보호 수단"의 모범 사례로 인용합니다. 이는 그룹의 향후 연구 면제 신청을 지원합니다.

anonym.legal이 이런 문제를 위해 구축된 이유를 알려면 창립자 성명을 읽어보십시오.

출처

데이터 보호를 시작할 준비가 되셨나요?

48개 언어로 285개 이상의 엔티티 유형으로 PII 익명화를 시작하세요.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.