By · Last updated 2026-06-05

Atpakaļ uz BloguGDPR un Atbilstība

Pētījumu PII: Ekrānuzņēmumi un GDPR

Akadēmiskie raksti regulāri ietver pandas DataFrames un R izvadi, kurā redzami reāli pacientu ieraksti kā metodikas piemēri. Lūk, kāpēc tas ir GDPR pārkāpums.

June 5, 20267 min lasīšanai
research dataacademic GDPRpublication privacyOCR image detectionArticle 89

Atjaunināts 2026. gadam — GDPR izpilde pret pētījumu grupām ir pieaugusi. Šis risks joprojām ir izplatīts publicētajos darbos.

Metodikas ekrānuzņēmumu problēma

Daudzi akadēmiskie raksti ietver analīzes rīku ekrānuzņēmumus. Mērķis ir parādīt metodi. Taču šie ekrānuzņēmumi var atklāt reālus personas ierakstus. Vairums pētnieku nepamanīja šo risku.

Šeit ir četri izplatīti gadījumi:

  • Mašīnmācīšanās rakstā redzams pandas DataFrame. Pirmajās 10 rindās ir reāli pacientu vārdi un ID.
  • Klīniskajā pētījumā redzama R izvade. Pacientu vērtības ir redzamas ekrānā. Pacientu ID redzami malā.
  • Sociālo zinātņu rakstā redzamas SPSS tabulas. Redzamas reālu cilvēku aptaujas atbildes.
  • Žurnāla apmācībā redzama Jupyter piezīmjdatora vide. Reāli lietotāju ieraksti kalpo kā paraugu rindas.

Katrā gadījumā autors gribēja parādīt metodi. Personas ieraksti nebija galvenais punkts. Tie vienkārši bija tur, lai padarītu piemēru reālistisku.

Taču "nav galvenais punkts" nenozīmē drošs. GDPR 4. panta 1. punkts saka, ka personas ieraksti ietver jebkurus faktus par identificētu personu. Pacientu ieraksts publicētā rakstā ir personas informācija. Nav svarīgi, vai tas atrodas ekrānuzņēmumā. Tā publicēšana bez piekrišanas vai juridiskā pamata saskaņā ar 6. pantu pārkāpj GDPR.

Skatiet GDPR atbilstības pārskatu, lai iegūtu vairāk informācijas par publicēšanas noteikumiem.

Kāpēc tas rada juridisko risku

Pētījumu grupas tagad saskaras ar lielāku GDPR izpildi. Publicēšanas kļūmes ir galvenais aktivizētājs. Izceļas četri riski.

Žurnāla atsaukšana. 17. pants dod cilvēkiem tiesības uz dzēšanu. Tas attiecas arī uz publicētiem ierakstiem. Ja persona atrod savus datus rakstā, viņa var lūgt to noņemšanu. Žurnālam tas bieži nozīmē atsaukšanu. Atsaukšana kaitē pētnieka karjerai.

Ētikas komitejas konstatējumi. Ētikas komitejas pārskata publicētos darbus. Tās pārbauda GDPR atbilstību. Tās ir sākušas atzīmēt rakstus, kuros ekrānuzņēmumos redzami personas ieraksti. Šīs atzīmes ietekmē pētnieka turpmāko darbu.

Datu piekļuves līgumu pārkāpumi. Pētījumu datu kopas nāk ar datu piekļuves līgumiem. Šajos noteikumos norādīts, kas var tikt publicēts. Ekrānuzņēmums ar personas ierakstiem var pārkāpt līgumu. Rezultāts bieži ir datu kopas piekļuves zaudēšana.

89. panta ierobežojumi. 89. pants atļauj personas informācijas izmantošanu zinātnei. Tas atvieglo dažus noteikumus. Taču tikai tur, kur pastāv pienācīgi aizsardzības pasākumi. Personas ierakstu rādīšana ekrānuzņēmumā bez de-identifikācijas nav aizsardzības pasākums. Tā ir pārkāpums.

Skatiet mūsu aizsardzības un aizsardzības pasākumu lapu, lai iegūtu pilnu sadalījumu.

Cik bieži tas notiek?

Šī problēma nav reta. Tā ietekmē publicētos darbus daudzās jomās.

To virza vairāki faktori.

Reproducējamības normas. Žurnāli vēlas metodes detaļas. Pētnieki izmanto ekrānuzņēmumus, lai apmierinātu šo vajadzību. Viņi ne vienmēr pārbauda, kas ir redzams katrā attēlā.

Stingri termiņi. Laika spiediens noved pie ātriem ekrānuzņēmumiem. Nav laika pārskatīt katru attēlu, lai atrastu atklātos ierakstus.

Zema redzamība attēlos. DataFrame var būt 20 kolonnas. Vārdi un ID var atrasties kolonnā tālu pa labi. Pētnieks skatās uz galveno kolonnu, nevis ID kolonnu.

Nav pārbaudes iesniegšanas laikā. Žurnālu portāli veic formāta pārbaudes un plaģiātisma skrīningus. Neviens nepārbauda attēlus personas entītijām. Nekas neatzīmē problēmu, pirms raksts kļūst pieejams.

Pārskata darbplūsma pētījumu grupām

Iesniegšanas iepriekšējs skrīninga process var apturēt šīs problēmas. Tam ir septiņi soļi.

  1. Pētnieks pabeidz manuskriptu ar visiem attēliem.
  2. Melnraksts nonāk pie iekšēja pārskatītāja — PI vai privātuma kontakta.
  3. Attēlu PII noteikšana darbojas uz visiem attēlu failiem manuskriptā.
  4. Ziņojums atzīmē attēlus ar lasāmu tekstu, kas atbilst personas entītiju rakstiem.
  5. Pētnieks pārskata atzīmētos attēlus.
  6. Katram atzīmētajam attēlam: aizstājiet to ar tīru ekrānuzņēmumu. Nomainiet pacienta ID 12847 ar ID 00001. Aizstājiet reālos vārdus ar "Pacients A".
  7. Galīgais manuskripta nonāk žurnālā ar tīriem attēliem.

Tehniskās iespējas:

  • Manuāla: Eksportējiet manuskriptu attēlus. Palaidiet partijas PII noteikšanu. Pārskatiet ziņojumu.
  • Daļēji automatizēta: Izmantojiet kopīgu mapi melnrakstiem. Palaidiet partijas apstrādi katru nedēļu uz jauniem failiem.
  • Darbplūsmā integrēta: Pievienojiet skrīninga soli iesniegšanas portālam.

Skrīnings ir ātrs. 15 attēlu manuskriptam attēlu PII noteikšana aizņem mazāk par divām minūtēm. Atsaukšana aizņem mēnešus.

Apmeklējiet BUJ vai vārdnīcu, lai uzzinātu vairāk par noteikšanas funkcijām.

Gadījuma izpēte: Eiropas universitāte

Viena pētījumu grupa pievienoja attēlu PII skrīningu savam manuskriptu darbplūsmai. Pārskats tika veikts pēc gandrīz notikuša incidenta. Pārskatāmajā rakstā bija pacientu vārdi DataFrame ekrānuzņēmumā.

Ko viņi darīja:

  • Visi melnraksta raksti tika apstrādāti attēlu PII noteikšanai pirms žurnāla iesniegšanas.
  • Skrīnings aptāva visus PNG, JPG un PDF attēlus katrā melnrakstā.
  • Privātuma kontakts pārskatīja rezultātus.

Rezultāti sešu mēnešu laikā:

  • 23 pārskatīti manuskripta.
  • 7 manuskripti (30%) saturēja vismaz vienu attēlu ar personas entītijām.
  • Atrastie veidi: pacientu vārdi DataFrames (4 raksti).
  • Lietotāju ID, kas atbilst pacientu formātiem (2 raksti).
  • E-pasta adreses ekrānuzņēmumu malās (1 raksts).
  • Visi 7 laboti pirms iesniegšanas.
  • Nulle atsaukšanas pieprasījumu vai ētikas konstatējumu pēc iesniegšanas.

Ētikas komiteja tagad min šo darbplūsmu kā modeļa "atbilstošu aizsardzības pasākumu" saskaņā ar 89. pantu. Tas atbalsta grupas turpmākos pētniecības izņēmumu pieteikumus.

Lasiet dibinātāja paziņojumu, lai uzzinātu, kāpēc anonym.legal tika izveidots šāda veida problēmām.

Avoti

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.