By · Last updated 2026-06-05

Tillbaka till BloggenGDPR & Efterlevnad

Forsknings-PII: Skärmdumpar och GDPR

Akademiska artiklar innehåller regelbundet pandas DataFrames och R-utdata som visar riktiga patientjournaler som metodikexempel. Här är varför detta är en GDPR-överträdelse.

June 5, 20267 min läsning
research dataacademic GDPRpublication privacyOCR image detectionArticle 89

Uppdaterat för 2026 — GDPR-tillsyn mot forskningsgrupper har ökat. Denna risk förblir vanlig i publicerat arbete.

Metodikskärmdumpsproblemet

Många akademiska artiklar innehåller skärmdumpar av analysverktyg. Målet är att visa metod. Men dessa skärmdumpar kan avslöja riktiga personliga uppgifter. De flesta forskare märker inte denna risk.

Här är fyra vanliga fall:

  • En maskininlärningsartikel visar en pandas DataFrame. De första 10 raderna har riktiga patientnamn och ID:n.
  • En klinisk studie visar R-utdata. Patientvärden är på skärmen. Patient-ID:n visas i marginalen.
  • En samhällsvetenskaplig artikel visar SPSS-tabeller. Enkätsvar från riktiga personer är synliga.
  • En tidskriftshandledning visar en Jupyter-notebook. Riktiga användaruppgifter används som exempelrader.

I varje fall avsåg författaren att visa metod. De personliga uppgifterna var inte poängen. De var bara där för att göra exemplet känslas mer verkligt.

Men "inte poängen" betyder inte säkert. GDPR Artikel 4(1) säger att personuppgifter inkluderar alla fakta om en identifierad person. En patientjournal i en publicerad artikel är personuppgifter. Det spelar ingen roll om den finns i en skärmdump. Att publicera den utan samtycke eller rättslig grund enligt Artikel 6 bryter mot GDPR.

Se GDPR-efterlevnadsöversikten för mer om publikationsregler.

Varför detta skapar juridisk risk

Forskningsgrupper möter nu mer GDPR-tillsyn. Publikationsmisslyckanden är en viktig utlösare. Fyra risker sticker ut.

Tidskriftsdragning. Artikel 17 ger människor rätten till radering. Detta gäller även publicerade uppgifter. Om en person hittar sina uppgifter i en artikel kan de begära borttagning. För en tidskrift innebär detta ofta tillbakadragning. Tillbakadragning skadar en forskares karriär.

Etikkommissionsfynd. Etikkommissioner granskar publicerat arbete. De kontrollerar GDPR-anpassning. De har börjat flagga artiklar som visar personuppgifter i skärmdumpar. Dessa flaggor påverkar en forskares framtida arbete.

Dataaccessavtalsöverträdelser. Forskningsdatauppsättningar levereras med Dataaccessavtal. Dessa regler anger vad som får publiceras. En skärmdump med personuppgifter kan bryta avtalet. Resultatet är ofta förlust av datauppsättningsåtkomst.

Artikel 89-begränsningar. Artikel 89 tillåter användning av personuppgifter för vetenskap. Det lättar på vissa regler. Men bara där lämpliga skyddsåtgärder finns. Att visa personuppgifter i en skärmdump utan de-identifiering är inte en skyddsåtgärd. Det är ett intrång.

Se vår skydds- och skyddsåtgärdssida för fullständig genomgång.

Hur ofta händer detta?

Detta problem är inte ovanligt. Det påverkar publicerat arbete inom många områden.

Få faktorer driver det.

Reproducerbarhetsnormer. Tidskrifter vill ha metoddetaljer. Forskare använder skärmdumpar för att uppfylla detta behov. De kontrollerar inte alltid vad som är synligt i varje bild.

Tight deadlines. Tidspress leder till snabba skärmdumpar. Det finns ingen tid att granska varje bild för exponerade uppgifter.

Låg synlighet i bilder. En DataFrame kan ha 20 kolumner. Namn och ID:n kan finnas i en kolumn långt till höger. Forskaren tittar på nyckelkolumnen, inte ID-kolumnen.

Ingen kontroll vid inlämning. Tidskriftsportaler kör formatgranskningar och plagiatskanning. Ingen kontrollerar bilder för personliga entiteter. Ingenting flaggar problemet innan artikeln publiceras.

Granskningsarbetsflöde för forskningsgrupper

En granskning före inlämning kan stoppa dessa problem. Det har sju steg.

  1. Forskaren slutför manuskriptutkastet med alla figurer.
  2. Utkastet går till en intern granskare — PI eller en sekretesskontakt.
  3. Bild-PII-identifiering körs på alla bildfiler i manuskriptet.
  4. Rapporten flaggar bilder med läsbar text som matchar personliga entitetsmönster.
  5. Forskaren granskar flaggade bilder.
  6. För varje flaggad bild: ersätt med en ren skärmdump. Byt patient-ID 12847 mot ID 00001. Ersätt riktiga namn med "Patient A."
  7. Slutmanuskriptet skickas till tidskriften med rena bilder.

Tekniska alternativ:

  • Manuellt: Exportera manuskriptbilder. Kör batch-PII-identifiering. Granska rapporten.
  • Halvautomatiserat: Använd en delad mapp för utkast. Kör batchbearbetning varje vecka på nya filer.
  • Arbetsflödesintegrerat: Lägg till ett granskningssteg i inlämningsportalen.

Granskning går snabbt. För ett 15-figurers manuskript tar bild-PII-identifiering under två minuter. Ett tillbakadragande tar månader.

Besök FAQ eller ordlistan för mer om identifieringsfunktioner.

Fallstudie: Europeiskt universitet

En forskningsgrupp lade till bild-PII-granskning i sitt manuskriptarbetsflöde. En nära miss utlöste förändringen. En artikel under granskning hade patientnamn i en DataFrame-skärmdump.

Vad de gjorde:

  • Alla utkast till artiklar bearbetades för bild-PII innan tidskriftsinlämning.
  • Granskning täckte alla PNG-, JPG- och PDF-figurer i varje utkast.
  • En sekretesskontakt granskade resultaten.

Resultat under sex månader:

  • 23 manuskript granskade.
  • 7 manuskript (30 %) hade minst en bild med personliga entiteter.
  • Typer som hittades: patientnamn i DataFrames (4 artiklar).
  • Användar-ID:n som matchar patientformat (2 artiklar).
  • E-postadresser i skärmdumpsmarginaler (1 artikel).
  • Alla 7 åtgärdades innan inlämning.
  • Noll förfrågningar om tillbakadragande eller etikfynd efter inlämning.

Etikkommissionen citerar nu detta arbetsflöde som ett föredömligt "lämpligt skydd" enligt Artikel 89. Det stöder gruppens framtida ansökningar om forskningsundantag.

Läs grundarens uttalande för att förstå varför anonym.legal byggdes för denna typ av problem.

Källor

Redo att skydda din data?

Börja anonymisera PII med 285+ entitetstyper på 48 språk.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.