By · Last updated 2026-05-18

Tillbaka till BloggenGDPR & Efterlevnad

Datatilsynet Danmark: CPR-Nummer Modulus-11...

67% av NLP-verktyg missar dansk CPR-nummer modulus-11 validering. Datatilsynets 14 sjukvårdsåtgärder 2024.

May 18, 20267 min läsning
Denmark DatatilsynetCPR modulus-11Danish healthcare GDPRhealth data anonymizationNordic compliance

Danmarks Datatilsynet utfärdade 31 GDPR-åtgärder 2024, varav 14 specifikt involverade sjukvårdsdatasystem — en koncentration som speglar de höga insatserna i Danmarks omfattande nationella hälsodatainfrastruktur och de tekniska misslyckanden som upprepade gånger exponerar patientdata.

CPR-Nummer: Modulus-11 Kravet

CPR-numret (Det Centrale Personregister-nummer) — 10 siffror, format DDMMYY-XXXX — kodar födelsedatum (siffror 1-6) och ett sekventiellt nummer med kontrollsiffra (siffror 7-10). Den sista siffran valideras med modulus-11 aritmetik:

Modulus-11 kontroll: multiplicera siffror 1-9 med vikter (4,3,2,7,6,5,4,3,2), summera, ta modulo 11. Om resultatet är 0, kontrollsiffra = 0. Om resultatet är 1, är CPR ogiltigt (ingen giltig kontrollsiffra finns för detta prefix). Annars, kontrollsiffra = 11 minus resultat.

Detta skapar den viktiga egenskapen att vissa DDMMYY-XXXX mönster aldrig kan vara giltiga CPR-nummer (de där modulo-11 beräkningen ger 1). Verktyg som mönster-matchar 10-siffriga nummer formaterade som DDMMYY-XXXX utan modulus-11 validering genererar falska positiva från datumsträngar, referensnummer och fakturakoder.

67% av generiska NLP-verktyg saknar CPR modulus-11 implementering (Datatilsynet 2024). Detta detektionsmisslyckande är den mest citerade tekniska bristen i Datatilsynets sjukvårdsåtgärder.

Danmarks Hälsodataforsknings Ekosystem

Danmarks hälsoregister — bland de mest kompletta longitudinella hälsodatamängderna i världen — är kopplade genom CPR-numret. CPR möjliggör för forskare att koppla:

  • Utskrivningsjournaler från sjukhus (från 1977)
  • Receptdatabas (från 1995)
  • Cancerregister (från 1943)
  • Dödsorsaksregister (från 1970)
  • Primärvårdsdiagnosdata (från 1990)

Denna kopplingsbarhet gör dansk hälsovetenskap världsklass men skapar en återidentifieringsrisk som Datatilsynet tar på allvar: även "de-anonymiserade" datamängder som behåller CPR-kopplade attribut (ålder, kön, diagnos, år) kan återidentifieras i kombination med andra datamängder.

Datatilsynets vägledning 2024 om sekundär användning av hälsodata kräver att organisationer som använder dessa register visar:

Teknisk anonymiseringsdokumentation: Inte ett policydokument, utan teknisk dokumentation som visar exakt vilka identifierare som togs bort, vilka kvasi-identifierare som generaliserades, och vilken k-anonymitetsnivå som uppnåddes i den utdata datamängden.

Tredjepartsvalidering för forskningsdatamängder: För forskningsdatamängder med mer än 5 000 individer rekommenderar Datatilsynet oberoende teknisk granskning av anonymiseringsprocedurer.

Dataminimering: Omfånget av forskningsdatamängden måste matcha den dokumenterade forskningsfrågan. Datatilsynet har funnit flera fall där forskare använde kompletta nationella register när ett slumpmässigt urval eller geografiskt begränsad datamängd skulle ha tjänat forskningssyftet.

Specifika Sjukvårdsåtgärder

Datatilsynets 14 sjukvårdsåtgärder 2024 dokumenterar återkommande tekniska misslyckanden:

Fallmönster 1: Sjukhus delar de-anonymiserad patientdatamängd med akademisk forskningspartner för AI-träning. Datamängden innehåller CPR-födelsedatumkomponenter, diagnoskoder och behandlingsdatum. Datatilsynet finner att kombinationen möjliggör återidentifiering av patienter med sällsynta sjukdomar (litet nämnareproblem — ovanliga diagnoser snävar av identifieringen avsevärt).

Fallmönster 2: Hälsoteknik-startup bearbetar danska patientdata genom en amerikansk AI-API för kliniskt dokumentationsstöd. CPR-nummer i medicinska anteckningar överförs till amerikanska servrar utan adekvat överföringsmekanism och utan föregående CPR-detektion och borttagning.

Fallmönster 3: Försäkringsbolag bearbetar medicinska intygsdata för funktionshinderanspråk. CPR-nummer i skannade PDF-intyg upptäcktes inte av företagets OCR-plus-extraktionspipeline (OCR konverterar bild till text; texten bearbetas men utan CPR-validering, många CPR-nummer missas i OCR-utdata på grund av formateringsartefakter).

OCR-plus-extraktionsmisslyckande är särskilt vanligt i sjukvårdssammanhang där dokument tas emot som skannade bilder. CPR-detektion måste fungera på OCR-bearbetad text, vilket ofta introducerar formateringsinkonsekvenser (mellanslag insatta mitt i nummer, bindestreckpositionfel) som bryter enkel mönsterigenkänning.

För dansk sjukvårds GDPR-efterlevnad: CPR-detektion med modulus-11 validering i både ren text och OCR-bearbetad utdata, danskspråkig NER (spaCy da_core_news), och teknisk anonymiseringsdokumentation som uppfyller Datatilsynets 2024 sekundära användningsstandarder är minimikrav.

Källor:

Redo att skydda din data?

Börja anonymisera PII med 285+ entitetstyper på 48 språk.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.