anonym.legal

By · Last updated 2026-06-05

Nazaj na blogGDPR in skladnost

Danska CPR: Validacija po modulu 11 za GDPR

67 % orodij NLP zamudi validacijo danske stevilke CPR po modulu 11. Datatilsynet je leta 2024 sprejel 14 izvrsnih ukrepov v zdravstvu. Sekundarna uporaba zdravstvenih podatkov.

June 5, 20267 min branja
Denmark DatatilsynetCPR modulus-11Danish healthcare GDPRhealth data anonymizationNordic compliance

Danske stevilke CPR: Vodnik za skladnost z GDPR

Posodobljeno za leto 2026

Danski podatkovni nadzornik, Datatilsynet, je leta 2024 izdal 31 odlocb po GDPR. Stirinajiht je zadevalo zdravstvene podatke. Ta visok delez odrazata dve dejstvi: Danska izvaja velik nacionalni zdravstveni sistem, tehnicne vrzeli v tem sistemu pa stalno razgaljajo pacientske evidence.

Pravilo o kontrolni stevki za stevilke CPR

Stevilka CPR je danski osebni identifikator. To je 10 stevk v formatu DDMMLL-XXXX. Prvih sest stevk je datum rojstva. Zadnje stiri so koda in kontrolna stevka.

Kontrolna stevka uporablja pravilo modulo 11:

  1. Vzamemo stevke 1 do 9.
  2. Vsakemu pripisemo ponder: 4, 3, 2, 7, 6, 5, 4, 3, 2.
  3. Vsako stevko pomnozimo z njenim pondrom. Sestejemo vse rezultate.
  4. Delimo z 11. Zapisemo ostanek.
  5. Ostanek 0 - kontrolna stevka je 0.
  6. Ostanek 1 - stevilka ni veljavna.
  7. Ostanek 2-10 - kontrolna stevka je 11 minus ostanek.

To pravilo je pomembno za vsako orodje, ki pregleduje stevilke CPR. Nekateri nizi DDMMLL-XXXX nikoli ne morejo biti veljavni. Orodja, ki ta korak preskocijo, oznacijo datume, sifre racunov in referenne stevilke kot prave identifikatorje.

Pregled organa iz leta 2024 je pokazal, da 67 % genericnih orodij NLP ta korak preskooci. Ta vrzel je najpogostejsa tehnicna napaka v zdravstvenih primerih organa.

Petih danskih zdravstvenih registrov

Danska povezuje zdravstvene podatke v petih nacionalnih registrih. Osebni identifikator jih povezuje vseh pet skupaj.

  • Evidence o bolnisnicnih odpustih (od leta 1977)
  • Podatki o receptih (od leta 1995)
  • Register raka (od leta 1943)
  • Register vzrokov smrti (od leta 1970)
  • Diagnoze primarne zdravstvene oskrbe (od leta 1990)

To naredi dansko zdravstveno raziskovanje zelo mocno. Ustvarja pa tudi tveganje. Odstranitev neobdelanega identifikatorja ni dovolj. Nabor podatkov, ki se vedno vsebuje starost, spol, diagnozo in leto, lahko znova razgali osebe - zlasti tiste z redkimi stanji.

Smernice Datatilsynet iz leta 2024 za sekundarno uporabo zdravstvenih podatkov postavljajo tri zahteve.

Zapisite, kaj ste storili s podatki: Navedite, katera polja ste odstranili, katera ste zaokrozili ali grupirali in katera velikost skupin dosega izhod. Opomba o politiki ne ustreza temu standardu.

Za velike nabore pridobite zunanjo revizijo: Za nabore podatkov z vec kot 5.000 osebami organ priporoca neodvisni tehnicni pregled korakov de-identifikacije.

Ujemite podatke z vprasanjem: Nabor podatkov mora ustrezati navedenemu cilju raziskave. Organ je nasel primere, ko so ekipe uporabile polne nacionalne registre, ko bi zadostoval manjsi vzorec.

Za primerjavo pravil o kontrolnih stevkah pri drugih evropskih formatih ID glejte nas vodnik za zaznavanje nacionalnih ID EU.

Kaj so pokazali primeri iz leta 2024

Stirinajiht zdravstvenih primerov deli tri skupne tipe napak.

Deljenje raziskovalnih podatkov: Bolnisnica poslje de-identificirani nabor podatkov o pacientih akademskemu partnerju za usposabljanje umetne inteligence. Nabor vsebuje dele datumov rojstev, kode diagnoz in datume zdravljenja. Organ ugotovi, da ta mesanica znova razgali paciente z redkimi boleznimi. Neobicajne diagnoze hitro zozijo skupino.

Storitve umetne inteligence tretjih strani: Podjetje za zdravstvene tehnologije poslje pacientske zapiske americani storitvi umetne inteligence za delo s klinicnimi evidencami. Osebni identifikatorji v teh zapiskih niso predhodno odstranjeni. Na voljo ni veljavnega mehanizma prenosa.

Vrzeli v cevovodu OCR: Zavarovalnica obdeluje skenirana obrazca PDF za zahtevke za invalidnost. Orodje OCR pretvori slike v besedilo. A ne izvaja kontrolnih testov stevilk na izhodu. Veliko identifikatorjev je zamudenih.

OCR pogosto vstavi presledke sredi stevilke ali premakne crtico. Preprosto ujemanje vzorcev se zlomi na takem izhodu. Zaznavanje mora delovati na besedilu OCR, ne le na cistem vnosu. Za postopke ravnanja s skeniranimi dokumenti glejte nas vodnik za zaznavanje OI v zdravstvenem OCR.

Tri tehnicne nujnosti

Ti trije elementi tvorijo osnovo za dansko zdravstveno skladnost z GDPR.

Testi kontrolnih stevk na vsem besedilu: Izvedite polno kontrolo modulo 11 na vsakem kandidatnem nizu. Uporabite jo tako za cisto besedilo kot za izhod OCR.

Zaznavanje danskih imen NER: Uporabite model, usposobljen na danskem besedilu. Model spaCy da_core_news je ena od moznosti. Genericni angleski model zamudi danska imena in imena organizacij.

Evidence de-identifikacije: Zapisite, kaj je bilo odstranjeno, kaj je bilo grupirano in velikost skupin izhoda. Organ to zahteva v tehnicni obliki, ne kot opombo o politiki.

Za podatke o stroskih incidentov z zdravstvenimi podatki glejte naso analizo stroskov krsitev v zdravstvu.

Viri

Ste pripravljeni zaščititi svoje podatke?

Začnite z anonimizacijo PII z več kot 285 tipi entitet v 48 jezikih.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.