Denemarke CPR-nommers: GDPR-nakomingsgids
Opgedateer vir 2026
Denemarke se datawagter, Datatilsynet, het 31 GDPR-besluite in 2024 uitgereik. Veertien het gesondheidsorgdata behels. Hierdie hoe aandeel weerspieel twee feite: Denemarke bestuur 'n groot nasionale gesondheidsstelsel, en tegniese gapings in daardie stelsel hou aan om pasientrekords bloot te stel.
Die Toetssyfer-reel vir CPR-nommers
'n CPR-nommer is Denemarke se persoonlike ID. Dit is 10 syfers in DDMMJJ-XXXX-formaat. Die eerste ses syfers is die geboortedatum. Die laaste vier is 'n kode plus 'n toetssyfer.
Die toetssyfer gebruik 'n modulus-11-reel:
- Neem syfers 1 tot 9.
- Gee elk 'n gewig: 4, 3, 2, 7, 6, 5, 4, 3, 2.
- Vermenigvuldig elke syfer met sy gewig. Tel alle resultate op.
- Deel deur 11. Neem die res.
- Res 0 - toetssyfer is 0.
- Res 1 - die nommer is nie geldig nie.
- Res 2-10 - toetssyfer is 11 minus die res.
Hierdie reel is belangrik vir enige instrument wat na CPR-nommers soek. Sommige DDMMJJ-XXXX-stringe kan nooit geldig wees nie. Instrumente wat hierdie stap oorslaan, merk datums, fakturekodes en verwysingsnommers as werklike ID's.
Die owerheid se 2024-hersiening het gevind dat 67% van generiese NLP-instrumente hierdie toets oorslaan. Hierdie gaping is die grootste tegniese fout in sy gesondheidsorggevalle.
Denemarke se Vyf Gesondheidsregisters
Denemarke koppel gesondheidsdata oor vyf nasionale registers. Die persoonlike ID verbind al vyf.
- Hospitaalontslag-rekords (vanaf 1977)
- Voorskrifdata (vanaf 1995)
- Kankerregister (vanaf 1943)
- Doodsoorsaakregister (vanaf 1970)
- Primere sorg-diagnoses (vanaf 1990)
Dit maak Deense gesondheidsnavorsing baie sterk. Dit skep ook 'n risiko. Die verwyder van die rouID is nie genoeg nie. 'n Datastel wat steeds ouderdom, geslag, diagnose en jaar bevat, kan mense heronthul - veral die met seldsame toestande.
Datatilsynet se 2024-leiding oor sekondere gesondheidsdata-gebruik stel drie vereistes.
Skryf neer wat jy met die data gedoen het: Lys watter velde jy verwyder het, watter jy afgerond of gegroepeer het, en watter groepgrootte die uitset behaal. 'n Beleidsnoota voldoen nie aan hierdie standaard nie.
Kry 'n buitesterehersiening vir groot stelle: Vir datastelle met meer as 5 000 mense beveel die owerheid 'n onafhanklike tegniese hersiening van die de-identifiseringstap aan.
Pas die data by die vraag: Die datastel moet by die verklaarde navorsingsdoel pas. Die owerheid het gevalle gevind waar spanne volledige nasionale registers gebruik het terwyl 'n kleiner steekproef sou gewerk het.
Sien ons EU nasionale ID-opsporingsgids vir hoe toetssyfer-reels op ander Europese ID-formate van toepassing is.
Wat die 2024-gevalle Gevind Het
Die 14 gesondheidsorggevalle deel drie algemene faling-tipes.
Navorsingsdataverspreiding: 'n Hospitaal stuur 'n gede-identifiseerde pasientdatastel na 'n akademiese vennoot vir KI-opleiding. Die stel bevat geboortedatum-dele, diagnose-kodes en behandelingsdatums. Die owerheid bevind dat hierdie mengsel pasiente met seldsame siektes heronthul. Ongewone diagnoses verklein die poel vinnig.
Derde-party KI-dienste: 'n Gesondheidstoegnologiefirma stuur pasientnotas na 'n VSA-gebaseerde KI-diens vir kliniese rekordwerk. Persoonlike ID's in daardie notas word nie eers verwyder nie. Geen geldige oorplasingsmeganisme is in plek nie.
OCR-pyplyn-gapings: 'n Versekeraar verwerk geskandeerde PDF-vorms vir gestremdheidseise. Sy OCR-instrument omskep beelde na teks. Maar dit voer nie toetssyfer-toetse op die uitset uit nie. Baie ID's word gemis.
OCR voeg dikwels spasies in die middel van 'n nommer in of verskuif die koppelteken. Eenvoudige patroonmassering breek op daardie uitset. Opsporing moet op OCR-teks werk, nie net skoon invoer nie. Sien ons OCR-gesondheidsorgopsporingsgids vir stappe om geskandeerde dokumente te hanteer.
Drie Tegniese Noodsaaklikhede
Hierdie drie elemente vorm die basis vir Deense gesondheidsorg-GDPR-nakoming.
Toetssyfer-toetse op alle teks: Voer die volledige modulus-11-toets op elke kandidaatstring uit. Pas dit op skoon teks en OCR-uitset gelyktydig toe.
Deense-taal naamopsporing: Gebruik 'n model wat op Deense teks opgelei is. Die spaCy da_core_news-model is een opsie. 'n Generiese Engelse model mis Deense name en organisasie-name.
De-identifiseringsrekords: Skryf neer wat verwyder is, wat gegroepeer is, en die uitset se groepgrootte. Die owerheid vra hiervoor in tegniese vorm, nie as 'n beleidsnoota nie.
Vir data oor die koste van gesondheidsorg-data-voorvalle, sien ons gesondheidsorgoorbreuk-koste-ontleding.