Danimarkako CPR Zenbakiak: GDPR Betetze-Gida
2026rako eguneratuta
Danimarkako datu-ikuskaritza, Datatilsynet, 2024an 31 GDPR erabaki eman zituen. Hamalau osasun-datuekin zerikusia zuten. Proportzioa altu horrek bi datu islatzen ditu: Danimarkak osasun-sistema nazional handi bat kudeatzen du, eta sistema horretako hutsune teknikoek pazienteen erregistroak agerian uzten jarraitzen dute.
CPR Zenbakietan Egiaztapen-Digituaren Araua
CPR zenbakia Danimarkako pertsona IDa da. 10 digitu ditu DDMMYY-XXXX formatuan. Lehen sei digitua jaiotze-data dira. Azken lau digitu kode bat eta egiaztapen-digitua dira.
Egiaztapen-digitua modulus-11 arau bat erabiltzen du:
- Hartu 1etik 9rako digitua.
- Eman bakoitzari pisu bat: 4, 3, 2, 7, 6, 5, 4, 3, 2.
- Biderkatu digit bakoitza bere pisuarekin. Batu emaitza guztiak.
- Zatitu 11z. Hartu hondarra.
- 0 hondarra: egiaztapen-digitua 0 da.
- 1 hondarra: zenbakia baliogabea da.
- 2-10 hondarra: egiaztapen-digitua 11 ken hondarra da.
Arau horrek garrantzia du CPR zenbakiak bilatzen dituen edozein tresnarentzat. DDMMYY-XXXX kate batzuek ezin dute sekula baliodun izan. Urrats hori saltatzen duten tresnek datak, faktura-kodeak eta erreferentzia-zenbakiak benetako ID gisa markatzen dituzte.
Agintaritzaren 2024ko berrikuspenak aurkitu du NLP tresna generikoen %67k egiaztapen hori saltatzen duela. Hutsune hori osasun-kasuentako akats tekniko nagusia da.
Danimarkako Bost Osasun-Erregistroak
Danimarkak osasun-datuak bost erregistro nazionaletan lotzen ditu. Pertsona IDak bost horiek guztiak lotzen ditu.
- Ospitaleko alta-erregistroak (1977tik)
- Preskripzio-datuak (1995etik)
- Minbiziaren erregistroa (1943tik)
- Heriotza-arrazoien erregistroa (1970etik)
- Lehen mailako arretako diagnostikoak (1990etik)
Horrek danimarkar osasun-ikerketa oso indartsua egiten du. Arrisku bat ere sortzen du. ID gordina kentzea ez da nahikoa. Adina, sexua, diagnostikoa eta urtea mantentzen dituen datu-multzoak berriro ere agerian utzi ditzake pertsonak, batez ere gaixotasun arraroak dituztenak.
Datatilsyneten 2024ko osasun-datuen bigarren mailako erabilerari buruzko gidak hiru baldintza ezartzen ditu.
Idatzi zer egin zenion datuei: Zerrendatu zein eremu kendu zenituztela, zeintzuk biribildu edo taldekatu zenituztela, eta irteeraren talde-tamaina zein den. Politika-ohar batek ez du estandar hori betetzen.
Eskuratu kanpoko berrikuspena multzo handientzat: 5.000 pertsonatik gorako datu-multzoetarako, agintaritzak desidentifikazio-urratsen berrikuspen tekniko independentea gomendatzen du.
Egokitu datuak galderara: Datu-multzoak adierazitako ikerketa-helburura egokitu behar du. Agintaritzak aurkitu ditu taldeak erregistro nazional osoak erabili zituzteneko kasuak, lagin txikiagoak funtzionatuko zukeenean.
Ikusi gure EBko nazio ID detekzio gida egiaztapen-digituen arauak beste Europako ID formatuetan nola aplikatzen diren jakiteko.
2024ko Kasuek Aurkitutakoa
14 osasun-kasuek hiru huts-mota ohikoak partekatzen dituzte.
Ikerketa-datuak partekatzea: Ospitale batek desidentifikatutako paziente-multzoa akademia-bazkide bati bidaltzen dio AI trebakuntza egiteko. Multzoak jaiotze-data zatiak, diagnostiko-kodeak eta tratamendu-datak ditu. Agintaritzak aurkitzen du nahastura honek gaixotasun arraroak dituzten pazienteak berriro agerian uzten dituela. Diagnostiko ezohikoak multzoa azkar murrizten dute.
Hirugarrenen AI zerbitzuak: Osasun-teknologia enpresa batek paziente-oharrak AEBetako AI zerbitzu bati bidaltzen dizkio erregistro klinikoen lanerako. Ohar horietan dauden ID pertsonalak ez dira aurrez kenduta. Indarreko transferentzia-mekanismorik ez dago.
OCR bideratzeko hutsuneak: Aseguru konpainia batek desgaitasun-erreklamaziotako PDF inprimatutako formak prozesatzen ditu. OCR tresnaren bidez irudiak testura bihurtzen ditu. Baina ez du egiaztapen-digituen probak irteeran exekutatzen. ID asko galtzen dira.
OCR-ek askotan zuriuneak txertatzen ditu zenbakiaren erdian edo marra desplazatzen du. Eredu-bateraketa sinpleak OCR testu horretan hausten da. Detekzioak OCR testuan funtzionatu behar du, ez sarrera garbian bakarrik. Ikusi gure OCR osasun-detekzio gida dokumentu eskaneraturak kudeatzeko urratsak.
Hiru Ezinbesteko Teknikoak
Hiru elementu hauek danimarkar osasun-GDPR betetzerako oinarria osatzen dute.
Egiaztapen-digituen probak testu guztietan: Exekutatu modulus-11 egiaztapen osoa hautagaien kate guztietan. Aplikatu testu garbian eta OCR irteeran.
Danimarkerazko izen-detekzioa: Erabili danimarkerazko testuan trebatutako eredu bat. spaCy da_core_news eredua aukera bat da. Ingelesezko eredu generiko batek danimarkar izenak eta erakunde-izenak galtzen ditu.
Desidentifikazio-erregistroak: Idatzi zer kendu zen, zer taldekatu zen eta irteeraren talde-tamaina. Agintaritzak forma teknikoan eskatzen du hori, politika-ohar gisa ez.
Osasun-datuen gorabeherek kostuen inguruko datuetarako, ikusi gure osasun-urraketa kostuaren analisia.