anonym.legal

By · Last updated 2026-06-05

Terug na BlogGDPR & Nakoming

Denemarke CPR: Modulus-11-validasie vir GDPR

67% van NLP-instrumente mis Deense CPR-nommer modulus-11-validasie. Datatilsynet se 14 gesondheidsorghandhawingsaksies in 2024. Sekondere gebruik van gesondheidsdata.

June 5, 20267 min lees
Denmark DatatilsynetCPR modulus-11Danish healthcare GDPRhealth data anonymizationNordic compliance

Denemarke CPR-nommers: GDPR-nakomingsgids

Opgedateer vir 2026

Denemarke se datawagter, Datatilsynet, het 31 GDPR-besluite in 2024 uitgereik. Veertien het gesondheidsorgdata behels. Hierdie hoe aandeel weerspieel twee feite: Denemarke bestuur 'n groot nasionale gesondheidsstelsel, en tegniese gapings in daardie stelsel hou aan om pasientrekords bloot te stel.

Die Toetssyfer-reel vir CPR-nommers

'n CPR-nommer is Denemarke se persoonlike ID. Dit is 10 syfers in DDMMJJ-XXXX-formaat. Die eerste ses syfers is die geboortedatum. Die laaste vier is 'n kode plus 'n toetssyfer.

Die toetssyfer gebruik 'n modulus-11-reel:

  1. Neem syfers 1 tot 9.
  2. Gee elk 'n gewig: 4, 3, 2, 7, 6, 5, 4, 3, 2.
  3. Vermenigvuldig elke syfer met sy gewig. Tel alle resultate op.
  4. Deel deur 11. Neem die res.
  5. Res 0 - toetssyfer is 0.
  6. Res 1 - die nommer is nie geldig nie.
  7. Res 2-10 - toetssyfer is 11 minus die res.

Hierdie reel is belangrik vir enige instrument wat na CPR-nommers soek. Sommige DDMMJJ-XXXX-stringe kan nooit geldig wees nie. Instrumente wat hierdie stap oorslaan, merk datums, fakturekodes en verwysingsnommers as werklike ID's.

Die owerheid se 2024-hersiening het gevind dat 67% van generiese NLP-instrumente hierdie toets oorslaan. Hierdie gaping is die grootste tegniese fout in sy gesondheidsorggevalle.

Denemarke se Vyf Gesondheidsregisters

Denemarke koppel gesondheidsdata oor vyf nasionale registers. Die persoonlike ID verbind al vyf.

  • Hospitaalontslag-rekords (vanaf 1977)
  • Voorskrifdata (vanaf 1995)
  • Kankerregister (vanaf 1943)
  • Doodsoorsaakregister (vanaf 1970)
  • Primere sorg-diagnoses (vanaf 1990)

Dit maak Deense gesondheidsnavorsing baie sterk. Dit skep ook 'n risiko. Die verwyder van die rouID is nie genoeg nie. 'n Datastel wat steeds ouderdom, geslag, diagnose en jaar bevat, kan mense heronthul - veral die met seldsame toestande.

Datatilsynet se 2024-leiding oor sekondere gesondheidsdata-gebruik stel drie vereistes.

Skryf neer wat jy met die data gedoen het: Lys watter velde jy verwyder het, watter jy afgerond of gegroepeer het, en watter groepgrootte die uitset behaal. 'n Beleidsnoota voldoen nie aan hierdie standaard nie.

Kry 'n buitesterehersiening vir groot stelle: Vir datastelle met meer as 5 000 mense beveel die owerheid 'n onafhanklike tegniese hersiening van die de-identifiseringstap aan.

Pas die data by die vraag: Die datastel moet by die verklaarde navorsingsdoel pas. Die owerheid het gevalle gevind waar spanne volledige nasionale registers gebruik het terwyl 'n kleiner steekproef sou gewerk het.

Sien ons EU nasionale ID-opsporingsgids vir hoe toetssyfer-reels op ander Europese ID-formate van toepassing is.

Wat die 2024-gevalle Gevind Het

Die 14 gesondheidsorggevalle deel drie algemene faling-tipes.

Navorsingsdataverspreiding: 'n Hospitaal stuur 'n gede-identifiseerde pasientdatastel na 'n akademiese vennoot vir KI-opleiding. Die stel bevat geboortedatum-dele, diagnose-kodes en behandelingsdatums. Die owerheid bevind dat hierdie mengsel pasiente met seldsame siektes heronthul. Ongewone diagnoses verklein die poel vinnig.

Derde-party KI-dienste: 'n Gesondheidstoegnologiefirma stuur pasientnotas na 'n VSA-gebaseerde KI-diens vir kliniese rekordwerk. Persoonlike ID's in daardie notas word nie eers verwyder nie. Geen geldige oorplasingsmeganisme is in plek nie.

OCR-pyplyn-gapings: 'n Versekeraar verwerk geskandeerde PDF-vorms vir gestremdheidseise. Sy OCR-instrument omskep beelde na teks. Maar dit voer nie toetssyfer-toetse op die uitset uit nie. Baie ID's word gemis.

OCR voeg dikwels spasies in die middel van 'n nommer in of verskuif die koppelteken. Eenvoudige patroonmassering breek op daardie uitset. Opsporing moet op OCR-teks werk, nie net skoon invoer nie. Sien ons OCR-gesondheidsorgopsporingsgids vir stappe om geskandeerde dokumente te hanteer.

Drie Tegniese Noodsaaklikhede

Hierdie drie elemente vorm die basis vir Deense gesondheidsorg-GDPR-nakoming.

Toetssyfer-toetse op alle teks: Voer die volledige modulus-11-toets op elke kandidaatstring uit. Pas dit op skoon teks en OCR-uitset gelyktydig toe.

Deense-taal naamopsporing: Gebruik 'n model wat op Deense teks opgelei is. Die spaCy da_core_news-model is een opsie. 'n Generiese Engelse model mis Deense name en organisasie-name.

De-identifiseringsrekords: Skryf neer wat verwyder is, wat gegroepeer is, en die uitset se groepgrootte. Die owerheid vra hiervoor in tegniese vorm, nie as 'n beleidsnoota nie.

Vir data oor die koste van gesondheidsorg-data-voorvalle, sien ons gesondheidsorgoorbreuk-koste-ontleding.

Bronne

Gereed om u data te beskerm?

Begin om PII te anonimiseer met 285+ entiteitstipes in 48 tale.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.