Numeros CPR de Dinamarca: Guia de Compliment del RGPD
Actualitzat per al 2026
El vigilant de dades de Dinamarca, el Datatilsynet, va emetre 31 resolucions del RGPD el 2024. Catorze van implicar dades sanitaries. Aquesta elevada proporcio reflecteix dos fets: Dinamarca gestiona un gran sistema nacional de salut, i les llacunes tecniques en aquest sistema continuen exposant els historials de pacients.
La Norma del Digit de Verificacio per als Numeros CPR
Un numero CPR es el DNI personal de Dinamarca. Te 10 digits en format DDMMAA-XXXX. Els primers sis digits son la data de naixement. Els quatre ultims son un codi mes un digit de verificacio.
El digit de verificacio utilitza una norma de modul 11:
- Es prenen els digits 1 a 9.
- Cada un rep un pes: 4, 3, 2, 7, 6, 5, 4, 3, 2.
- Cada digit es multiplica pel seu pes. S'agreguen tots els resultats.
- Es divideix per 11. S'anota el residu.
- Residu 0: el digit de verificacio es 0.
- Residu 1: el numero no es valid.
- Residu 2-10: el digit de verificacio es 11 menys el residu.
Aquesta norma es important per a qualsevol eina que escaneja numeros CPR. Algunes cadenes DDMMAA-XXXX mai no poden ser valides. Les eines que ometen aquest pas marquen dates, codis de factura i numeros de referencia com a DNI reals.
La revisio del 2024 de l'autoritat va constatar que el 67% de les eines generiques de PLN ometen aquesta comprovacio. Aquesta llacuna es la principal fallada tecnica en els seus casos de sanitat.
Els Cinc Registres Sanitaris de Dinamarca
Dinamarca vincula les dades sanitaries en cinc registres nacionals. El DNI personal les uneix totes cinc.
- Registres d'altes hospitalaries (des del 1977)
- Dades de prescripcions (des del 1995)
- Registre del cancer (des del 1943)
- Registre de causes de mort (des del 1970)
- Diagnostics d'atencio primaria (des del 1990)
Aixo fa que la recerca sanitaria danesa sigui molt solida. Tambe crea un risc. Eliminar el DNI brut no es suficient. Un conjunt de dades que encara conte edat, sexe, diagnostic i any pot reidentificar persones, especialment les que tenen malalties rares.
L'orientacio del Datatilsynet del 2024 sobre l'us secundari de dades sanitaries estableix tres requisits.
Documentar el tractament de les dades: Cal llistar quins camps s'han eliminat, quins s'han arrodonit o agrupat, i quin tamany de grup aconsegueix el resultat. Una nota de politica no compleix aquest estandard.
Obtenir una revisio externa per a conjunts grans: Per a conjunts de dades amb mes de 5.000 persones, l'autoritat recomana una revisio tecnica independent dels passos de desidentificacio.
Adaptar les dades a la pregunta: El conjunt de dades ha d'encaixar amb l'objectiu de recerca indicat. L'autoritat va trobar casos on els equips van utilitzar registres nacionals complets quan una mostra mes petita hauria funcionat.
Vegeu la nostra guia de deteccio de DNI nacionals de la UE per veure com les normes de digit de verificacio s'apliquen a altres formats d'identitat europeus.
Que Van Trobar els Casos del 2024
Els 14 casos de sanitat comparteixen tres tipus comuns de fallada.
Comparticio de dades de recerca: Un hospital envia un conjunt de dades de pacients desidentificat a un socio academic per a l'entrenament d'IA. El conjunt conte parts de dates de naixement, codis de diagnostic i dates de tractament. L'autoritat determina que aquesta combinacio reidentifica pacients amb malalties rares. Els diagnostics inusuals redueixen rapidament el grup.
Serveis d'IA de tercers: Una empresa de tecnologia sanitaria envia notes de pacients a un servei d'IA basat als EUA per a la tasca de registres clinics. Els DNI personals d'aquestes notes no s'eliminen primer. No hi ha cap mecanisme de transferencia valid en vigor.
Llacunes en la cadena de processament d'OCR: Una asseguradora processa formularis PDF escanejats per a reclamacions d'invalidesa. La seva eina d'OCR converteix les imatges en text. Pero no realitza proves de digit de verificacio sobre el resultat. Es perden molts DNI.
L'OCR sovint insereix espais a meitat d'un numero o desplaca el guio. La concordanca de patrons simple falla amb aquest resultat. La deteccio ha de funcionar en text d'OCR, no nomes en entrades netes. Vegeu la nostra guia de deteccio sanitaria d'OCR per als passos per gestionar documents escanejats.
Tres Requisits Tecnics Essencials
Aquests tres elements formen la base per al compliment del RGPD sanitari danes.
Proves de digit de verificacio en tot el text: S'ha d'executar la comprovacio completa de modul 11 en cada cadena candidata. S'ha d'aplicar tant al text net com al resultat d'OCR.
Deteccio de noms en danes: Cal utilitzar un model entrenat en text danes. El model spaCy da_core_news es una opcio. Un model generic en angles no detecta noms i noms d'organitzacions danesos.
Registres de desidentificacio: Cal documentar que s'ha eliminat, que s'ha agrupat i el tamany del grup del resultat. L'autoritat ho demana en forma tecnica, no com a nota de politica.
Per a dades sobre el cost dels incidents de dades sanitaries, vegeu la nostra analisi del cost de les violacions en sanitat.