Numerele CPR din Danemarca: Ghid de Conformitate GDPR
Actualizat pentru 2026
Autoritatea daneză de supraveghere a datelor, Datatilsynet, a emis 31 de decizii GDPR în 2024. Paisprezece au vizat date medicale. Această pondere ridicată reflectă două realități: Danemarca administrează un sistem național de sănătate extins, iar lacunele tehnice din acest sistem continuă să expună înregistrările pacienților.
Regula Cifrei de Control pentru Numerele CPR
Numărul CPR este ID-ul personal al Danemarcei. Are 10 cifre în formatul ZZLLAA-XXXX. Primele șase cifre reprezintă data nașterii. Ultimele patru sunt un cod plus o cifră de control.
Cifra de control folosește regula modulus-11:
- Se preiau cifrele de la 1 la 9.
- Fiecăreia i se atribuie un coeficient: 4, 3, 2, 7, 6, 5, 4, 3, 2.
- Se înmulțește fiecare cifră cu coeficientul său. Se adună toate rezultatele.
- Se împarte la 11. Se notează restul.
- Rest 0 → cifra de control este 0.
- Rest 1 → numărul nu este valid.
- Rest 2–10 → cifra de control este 11 minus restul.
Această regulă contează pentru orice instrument care scanează numere CPR. Unele șiruri ZZLLAA-XXXX nu pot fi niciodată valide. Instrumentele care sar acest pas marchează date, coduri de facturi și numere de referință ca ID-uri reale.
Revizuirea din 2024 a autorității a constatat că 67% dintre instrumentele NLP generice sar această verificare. Această lacună este principalul eșec tehnic în cazurile sale de sănătate.
Cele Cinci Registre de Sănătate ale Danemarcei
Danemarca corelează datele de sănătate din cinci registre naționale. ID-ul personal leagă toate cinci.
- Înregistrări de externare spitalicească (din 1977)
- Date privind rețetele (din 1995)
- Registrul de cancer (din 1943)
- Registrul cauzelor de deces (din 1970)
- Diagnostice din asistența medicală primară (din 1990)
Acest lucru face cercetarea medicală daneză foarte solidă. Creează și un risc. Eliminarea ID-ului brut nu este suficientă. Un set de date care mai conține vârstă, sex, diagnostic și an poate reexpune persoanele — mai ales cele cu afecțiuni rare.
Orientările din 2024 ale Datatilsynet privind utilizarea secundară a datelor medicale stabilesc trei cerințe.
Documentați ce ați făcut cu datele: Enumerați câmpurile eliminate, pe cele rotunjite sau grupate și dimensiunea grupului realizată în ieșire. O notă de politică nu îndeplinește acest standard.
Solicitați o revizuire externă pentru seturi mari: Pentru seturile de date cu mai mult de 5.000 de persoane, autoritatea recomandă o revizuire tehnică independentă a etapelor de eliminare a identificatorilor.
Potriviți datele cu întrebarea: Setul de date trebuie să corespundă scopului de cercetare declarat. Autoritatea a găsit cazuri în care echipele au utilizat registrele naționale complete când un eșantion mai mic ar fi fost suficient.
Consultați ghidul nostru de detectare a ID-urilor naționale UE pentru cum se aplică regulile cifrelor de control la alte formate de ID europene.
Ce Au Găsit Cazurile din 2024
Cele 14 cazuri din sănătate au trei tipuri comune de eșec.
Partajarea datelor de cercetare: Un spital trimite un set de date de pacienți pseudo-anonimizat unui partener academic pentru antrenarea AI. Setul conține fragmente din data nașterii, coduri de diagnostic și date de tratament. Autoritatea constată că această combinație reexpune pacienții cu boli rare. Diagnosticele neobișnuite reduc rapid grupul.
Servicii AI de la terțe părți: O firmă de tehnologie medicală trimite note de pacienți unui serviciu AI bazat în SUA pentru procesarea dosarelor clinice. ID-urile personale din acele note nu sunt eliminate în prealabil. Nu există un mecanism de transfer valabil.
Lacune în conductele OCR: Un asigurător procesează formulare PDF scanate pentru cererile de invaliditate. Instrumentul OCR convertește imaginile în text, dar nu efectuează teste cu cifre de control pe ieșire. Multe ID-uri sunt omise.
OCR inserează adesea spații în mijlocul unui număr sau deplasează cratima. Potrivirea simplă de șabloane eșuează pe acel rezultat. Detectarea trebuie să funcționeze pe textul OCR, nu doar pe inputul curat. Consultați ghidul nostru de detectare OCR în sănătate pentru pașii de gestionare a documentelor scanate.
Trei Cerințe Tehnice Esențiale
Aceste trei elemente formează baza conformității GDPR în sănătatea daneză.
Teste cu cifre de control pe toate textele: Rulați verificarea completă modulus-11 pe fiecare șir candidat. Aplicați-o atât pe text curat, cât și pe ieșirea OCR.
Detectarea numelor în daneză: Utilizați un model antrenat pe text danez. Modelul spaCy da_core_news este o opțiune. Un model general în engleză ratează numele daneze și denumirile organizațiilor.
Înregistrări de eliminare a identificatorilor: Documentați ce a fost eliminat, ce a fost grupat și dimensiunea grupului din ieșire. Autoritatea solicită aceasta în formă tehnică, nu ca notă de politică.
Pentru date privind costul incidentelor cu date medicale, consultați analiza noastră a costurilor breșelor în sănătate.