By · Last updated 2026-06-05

Atgal į BlogąGDPR ir Atitiktis

Moksliniai tyrimai ir asmens duomenys: ekrano kopijos ir BDAR

Akademiniuose straipsniuose reguliariai pateikiamos pandas DataFrame ir R išvestys su realiais pacientų įrašais kaip metodikos pavyzdžiais. Štai kodėl tai yra BDAR pažeidimas.

June 5, 20267 min skaityti
research dataacademic GDPRpublication privacyOCR image detectionArticle 89

Atnaujinta 2026 m. — BDAR vykdymas prieš mokslinių tyrimų grupes išaugo. Ši rizika lieka įprasta skelbiamame darbe.

Metodikos ekrano kopijų problema

Daugelyje akademinių straipsnių yra analizės įrankių ekrano kopijų. Tikslas — parodyti metodą. Tačiau tos ekrano kopijos gali atskleisti realius asmeninius įrašus. Dauguma tyrėjų šios rizikos nepastebi.

Štai keturi dažni atvejai:

  • Mašininio mokymosi straipsnyje rodoma pandas DataFrame. Pirmose 10 eilučių yra realūs pacientų vardai ir ID.
  • Klinikiniame tyrime rodoma R išvestis. Pacientų reikšmės ekrane. Pacientų ID matomos paraštėje.
  • Socialinių mokslų straipsnyje rodomos SPSS lentelės. Matomos realių žmonių apklausos atsakymai.
  • Žurnalo pamoka rodo Jupyter užrašų knygą. Realūs vartotojų įrašai naudojami kaip pavyzdinės eilutės.

Kiekvienu atveju autorius norėjo parodyti metodą. Asmeniniai įrašai nebuvo tikslas. Jie tiesiog buvo ten, kad pavyzdys atrodytų realistiškai.

Tačiau "nebuvo tikslas" nereiškia saugaus. BDAR 4 straipsnio 1 dalis nurodo, kad asmeniniai įrašai apima bet kokius faktus apie identifikuotą asmenį. Paciento įrašas publikuotame straipsnyje yra asmeninė informacija. Nesvarbu, ar jis yra ekrano kopijoje. Jo paskelbimas be sutikimo arba teisinio pagrindo pagal 6 straipsnį pažeidžia BDAR.

Žr. BDAR atitikties apžvalgą daugiau informacijos apie publikavimo taisykles.

Kodėl tai kelia teisinę riziką

Mokslinių tyrimų grupės dabar susiduria su didesniu BDAR vykdymu. Publikavimo klaidos yra svarbus atsiradimo veiksnys. Išsiskiria keturios rizikos.

Žurnalo retraktavimas. 17 straipsnis suteikia žmonėms teisę į ištrynimą. Tai taikoma ir publikuotiems įrašams. Jei asmuo randa savo duomenis straipsnyje, jis gali prašyti jų pašalinimo. Žurnalui tai dažnai reiškia retraktavimą. Retraktavimas kenkia tyrėjo karjerai.

Etikos komiteto radiniai. Etikos komitetai peržiūri publikuotus darbus. Jie tikrina BDAR atitiktį. Jie pradėjo žymėti straipsnius, kuriuose ekrano kopijose rodomi asmeniniai įrašai. Šie žymenys veikia tyrėjo būsimą darbą.

Duomenų prieigos sutarties pažeidimai. Mokslinių tyrimų duomenų rinkiniai pateikiami su Duomenų prieigos sutartimis. Šios taisyklės nurodo, ką galima skelbti. Ekrano kopija su asmeniniais įrašais gali pažeisti sutartį. Rezultatas dažnai yra prieigos prie duomenų rinkinio praradimas.

89 straipsnio apribojimai. 89 straipsnis leidžia naudoti asmeninę informaciją mokslui. Jis palengvina kai kurias taisykles. Tačiau tik ten, kur yra tinkamos apsaugos priemonės. Asmeninių įrašų rodymas ekrano kopijoje be deidentifikavimo nėra apsaugos priemonė. Tai yra pažeidimas.

Žr. mūsų apsaugos priemonių puslapį išsamiam suskirstymui.

Kaip dažnai tai nutinka?

Ši problema nėra reta. Ji veikia publikuotus darbus įvairiose srityse.

Keturi veiksniai lemia tai.

Atkuriamumas normos. Žurnalai nori išsamių metodų. Tyrėjai naudoja ekrano kopijas šiam poreikiui patenkinti. Jie ne visada tikrina, kas matoma kiekviename vaizde.

Griežti terminai. Laiko spaudimas lemia greitas ekrano kopijas. Nėra laiko peržiūrėti kiekvieną vaizdą dėl atskleistų įrašų.

Mažas matomumas vaizduose. DataFrame gali turėti 20 stulpelių. Vardai ir ID gali būti stulpelyje toli dešinėje. Tyrėjas žiūri į pagrindinį stulpelį, o ne ID stulpelį.

Jokio patikrinimo pateikiant. Žurnalų portalai vykdo formato patikrinimus ir plagijavimo tikrinimą. Nė vienas netikrina vaizdų dėl asmeninių objektų. Niekas nepažymi problemos prieš straipsnio paskelibimą.

Tikrinimo darbo eiga mokslinių tyrimų grupėms

Ikipateikimo tikrinimo procesas gali sustabdyti šias problemas. Jame yra septyni žingsniai.

  1. Tyrėjas baigia rankraščio projektą su visomis iliustracijomis.
  2. Projektas perduodamas vidaus peržiūrėtojui — PI arba privatumo kontaktui.
  3. Vaizdo asmens duomenų aptikimas vykdomas visuose rankraščio vaizdo failuose.
  4. Ataskaita pažymi vaizdus su skaitomu tekstu, atitinkančiu asmeninių objektų šablonus.
  5. Tyrėjas peržiūri pažymėtus vaizdus.
  6. Kiekvienam pažymėtam vaizdui: pakeiskite jį švaria ekrano kopija. Pakeiskite paciento ID 12847 į ID 00001. Pakeiskite realius vardus "Pacientu A".
  7. Galutinis rankraštis siunčiamas į žurnalą su švariais vaizdais.

Techninės galimybės:

  • Rankinis: Eksportuokite rankraščio vaizdus. Vykdykite paketinį asmens duomenų aptikimą. Peržiūrėkite ataskaitą.
  • Pusiau automatizuotas: Naudokite bendrinamą aplanką projektams. Vykdykite paketinį apdorojimą kiekvieną savaitę su naujais failais.
  • Integruotas į darbo eigą: Pridėkite tikrinimo žingsnį prie pateikimo portalo.

Tikrinimas yra greitas. 15 iliustracijų rankraščiui vaizdo asmens duomenų aptikimas užtrunka mažiau nei dvi minutes. Retraktavimas trunka mėnesius.

Apsilankykite DUK arba žodyne daugiau informacijos apie aptikimo funkcijas.

Atvejo analizė: Europos universitetas

Viena mokslinių tyrimų grupė į savo rankraščių darbo eigą įtraukė vaizdo asmens duomenų tikrinimą. Pokyčius paskatino netoli buvusi problema. Peržiūrimame straipsnyje DataFrame ekrano kopijoje buvo pacientų vardai.

Ką jie padarė:

  • Visi projektiniai straipsniai buvo tikrinami dėl vaizdo asmens duomenų prieš žurnalo pateikimą.
  • Tikrinimas apėmė visus PNG, JPG ir PDF paveikslus kiekviename projekte.
  • Privatumo kontaktas peržiūrėjo rezultatus.

Rezultatai per šešis mėnesius:

  • Patikrinti 23 rankraščiai.
  • 7 rankraščiai (30 %) turėjo bent vieną vaizdą su asmeniniais objektais.
  • Rasti tipai: pacientų vardai DataFrame (4 straipsniai).
  • Vartotojų ID, atitinkantys pacientų formatus (2 straipsniai).
  • El. pašto adresai ekrano kopijų paraštėse (1 straipsnis).
  • Visi 7 pataisyti prieš pateikimą.
  • Nulis retraktavimo prašymų ar etikos radišų po pateikimo.

Etikos komitetas dabar nurodo šią darbo eigą kaip modelinę "tinkamą apsaugos priemonę" pagal 89 straipsnį. Ji palaiko grupės būsimus mokslinių tyrimų išimties prašymus.

Skaitykite įkūrėjo pareiškimą, kad sužinotumėte, kodėl anonym.legal buvo sukurta tokio pobūdžio problemoms.

Šaltiniai

Pasiruošę apsaugoti savo duomenis?

Pradėkite anonimizuoti PII su 285+ subjektų tipais 48 kalbomis.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.