By · Last updated 2026-06-05

Tagasi BlogisseGDPR ja Vastavus

Teadusartiklid ja GDPR: ekraanipiltide isikuandmed

Teadusartiklid sisaldavad regulaarselt pandas DataFrame'e ja R-i vaeljundeid, mis naetavad tegelikke patsiendiandmeid metodoloogiliste naedetena. See on GDPR-rikkumine.

June 5, 20267 min lugemist
research dataacademic GDPRpublication privacyOCR image detectionArticle 89

Uuendatud 2026. aastaks -- GDPR-i taeitmise nouded teadusruhhmade vastu on kasvanud. See risk on avaldatud toodes jaetkuvalt tavaline.

Metodoloogia ekraanipiltide probleem

Paljud teadusartiklid sisaldavad analueusitoolide ekraanipilte. Eesmaeark on naetada meetodit. Kuid need ekraanipildid voivad paljastada tegelikke isikuandmeid. Enamik teadlasi ei paane seda ohtu taehele.

Siin on neli tavalist juhtumit:

  • Masinoppimisel baseeruv artikkel naetab pandas DataFrame'i. Esimesed 10 rida sisaldavad tegelikke patsiendi nimesid ja ID-sid.
  • Kliiniline uuring naetab R-i vaeljundit. Patsientide vaartused on ekraanil nahtavad. Patsientide ID-d naetavad vaervis.
  • Sotsiaalteaduslik artikkel naetab SPSS-i tabeleid. Tegelike inimeste kueisitlusvastused on naetavad.
  • Ajakirja oppeaan naetab Jupyter notepad'i. Tegelikud kasutajaandmed toimivad naeidiridadena.

Igal juhul tahtis autor naetada meetodit. Isikuandmed ei olnud pohjus. Need olid lihtsalt seal, et naeide tunduksid toeparane.

Kuid "mitte pohjus" ei taehenda ohutust. GDPR artikkel 4(1) oeelb, et isikuandmed hulmaavad koik andmed tuvastatud isiku kohta. Avaldatud artiklites olev patsiendiandmek on isikuandmeid. Ei ole taehtsust, et need on ekraanipildil. Avaldamine ilma nousoleku voi artikli 6 seadusliku aluseta rikub GDPR-i.

Vaadake GDPR-i vastavuse ulevaadet avaldamiseestkirju kohta lisateabe saamiseks.

Miks see tekitab juriidilise riski

Teadusruehmad seisavad nueud silmitsi suurema GDPR-i jaerelvalvega. Avaldamise ebaonnestumised on peamised kaivitajad. Neli riskitegurit paistab silma.

Ajakirja tulemusel tagasivotmine. Artikkel 17 annab inimestele kustutamisoiguse. See kehtib avaldatud andmete suhtes. Kui isik leiab oma andmed artiklist, voib ta nouda eemaldamist. Ajakirja jaoks taehendab see sageli tagasivotmist. Tagasivoatmine kahjustab teadlase karjaeaeri.

Eetikakomitee leiud. Eetikakomiteed vaatavad avaldatud tood uuele. Nad kontrollivad GDPR-i vastavust. Nad on hakanud lipistama artikleid, kus ekraanipiltidel naetavad isikuandmeid. Need lipistad mojutavad teadlase tulevast toeaed.

Andmelepingute rikkumised. Teadusandmestikud on saadaval koos andmeloele peaasudimise lepingutega. Need reeglid maeaervad, mida voib avaldada. Ekraanipilt isikuandmetega voib lepingut rikkuda. Tulem on sageli andmekogu lopetamine.

Artikli 89 piirangud. Artikkel 89 lubab isikuandmeid teaduse jaoks kasutada. See leevendab moningaid reegleid. Kuid ainult seal, kus on olemas sobivad kaitsemeetmed. Isikuandmete naetamine ekraanipildil ilma de-identifitseerimiseta ei ole kaitsemeede. See on rikkumine.

Vaadake meie kaitse ja kaitsemeetmete lehte taeieliku jagunemise jaoks.

Kui sageli see juhtub?

See probleem ei ole haruldane. See mojutab avaldatud toeaed paljudes valdkondades.

Mitu tegurit juhtivad seda.

Reprodutseeritavuse normid. Ajakirjad soovivad meetodi ueksikasju. Teadlased kasutavad ekraanipilte selle normi taeitmiseks. Nad ei kontrolli alati, mis on igal pildil nahtav.

Tiuged taehtajad. Ajanore julgustab kiireid ekraanipilte. Pole aega iga pilti isikuandmete osas uuele labivaadata.

Madal nahtavus piltidel. DataFrame'il voib olla 20 veergu. Nimed ja ID-d voivad olla paremal asuvas veerus. Teadlane vaatab pohiveergu, mitte ID veergu.

Puudub kontroll esitamisel. Ajakirja portaalid kaivitavad vormi kontrolle ja plagiaadiuurimisi. Uhtegi neist ei kontrollita piltidel olevaid isiklikke uksuseid. Miski ei lipista probleemi enne, kui artikkel on avaldatud.

Eelsuhtelus voostik teadusruhmmade jaoks

Eelne suhteluse suhteluse protsess voib need probleemid peatada. Sellel on seitse sammu.

  1. Teadlane lopetab kaesikirja eelloo koigi joonistega.
  2. Mustand laeheb sisemisele uuvaatajale -- PI-le voi privaatsuskontaktile.
  3. Piltide isikuandmete tuvastus kaivitub koeigil kaeesikirjas olevatel pildifailidel.
  4. Aruanne lipistab pildid loetava tekstiga, mis vastab isikuandmete mustritele.
  5. Teadlane vaatab lipistatud pildid yle.
  6. Iga lipistatud pildi puhul: asendage see puhta ekraanipildiga. Asendage patsiendi ID 12847 ID-ga 00001. Asendage tegelikud nimed nimetusega "Patsient A".
  7. Loplik kaesitkiri laeheb ajakirja puhaste piltidega.

Tehnilised valikud:

  • Kaesilise: Eksportige kaesikirja pildid. Kaevitage partiide isikuandmete tuvastus. Vaadake aruanne yle.
  • Poolautomaatne: Kasutage kavandite jaoks jagatud kausta. Kaivitage uute failide naedalane partiitootlemine.
  • Voostusse integreeritud: Lisage suhteluse portaali kontrollietapp.

Uurimus on kiire. 15-koujutisega kaesikirja puhul votab pildi isikuandmete tuvastamine alla kahe minuti. Tagasivoatmine votab kuud.

Kusimuste jaoks kulaastage KKK-d voi glossaari tuvastuse funktsioonide kohta.

Juhtumiuuring: Euroopa ulikool

Uks teadusruhm lisas oma kaeskirja voostusse piltide isikuandmete uurimise. Selle kaivitas peaaegu olukorraveel. DataFrame'i ekraanipildil olid arvustuses oleval artiklil patsiendinimed.

Mida nad tegid:

  • Koiki mustandiartikleid tootleti pildi isikuandmete osas enne ajakirjale esitamist.
  • Uurimine haelmas koiki PNG-, JPG- ja PDF-koujutisi igaselles mustandis.
  • Privaatsuskontakt vaatas tulemused yle.

Tulemused kuue kuu jooksul:

  • 23 uuritud kaeesikirja.
  • 7 kaeesikirjas (30%) oli vaehemalt uks pilt isikuandmetega.
  • Leitud tupid: patsiendinimed DataFrame'ides (4 artiklis).
  • Kasutaja ID-d, mis vastasid patsiendi vormatitele (2 artiklis).
  • E-posti aealdressid ekraanipiltide vaervis (1 artiklis).
  • Koik 7 parandati enne esitamist.
  • Nulle tagasivotmistaoused ega eetikas leiud parast esitamist.

Eetikakomitee tsiteerib nuued seda voovoogu mudel "sobiva kaitsemeetmena" artikli 89 alusel. See toetab ryhma tulevasi teaduse erandi taotlusi.

Lugege asutaja avaldust, et teada saada, miks anonym.legal sellelaadsete probleemide jaoks ehitati.

Allikad

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.