Danmörk CPR-númer: GDPR-samræmisleiðbeiningar
Uppfært fyrir 2026
Gagnaverndarvörður Danmerkur, Datatilsynet, gaf út 31 GDPR-úrskurð árið 2024. Fjórtán fólu í sér heilbrigðisgögn. Þetta háa hlutfall endurspeglar tvær staðreyndir: Danmörk rekur stórt þjóðlegt heilbrigðiskerfi og tæknibrestur í því kerfi heldur áfram að afhjúpa sjúklingaskrár.
Athugunartalnareglur fyrir CPR-númer
CPR-númer er persónulegt auðkenni Danmerkur. Það er 10 stafir á DDMMYY-XXXX sniði. Fyrstu sex stafirnir eru fæðingardagsetningin. Síðustu fjórir eru kóður ásamt athugunartölu.
Athugunartalan notar modulus-11 reglu:
- Taktu stafi 1 til 9.
- Gefðu hverjum þyngd: 4, 3, 2, 7, 6, 5, 4, 3, 2.
- Margfaldaðu hvern staf með þyngd hans. Leggðu saman allar niðurstöðurnar.
- Deildu með 11. Skráðu leifina.
- Leif 0 → athugunartalan er 0.
- Leif 1 → númerið er ekki gilt.
- Leif 2–10 → athugunartalan er 11 mínus leifin.
Þessi regla skiptir máli fyrir hvert sem er tæki sem skannar að CPR-númerum. Sum DDMMYY-XXXX strengir geta aldrei verið gild. Verkfæri sem sleppa þessu þrepi merkja dagsetningar, reikningskóða og tilvísunarnúmer sem raunveruleg auðkenni.
Útgáfa stofnunarinnar 2024 leiddi í ljós að 67% almenningra NLP-verkfæra sleppa þessari athugun. Þetta bil er efsta tæknilegi bresturinn í heilbrigðismálum hennar.
Fimm heilsugagnahópar Danmerkur
Danmörk tengir heilbrigðisgögn yfir fimm þjóðlega gagnahópa. Persónulega auðkennið tengir alla fimm saman.
- Sjúkrahúsútskriftarskrár (frá 1977)
- Lyfjagögn (frá 1995)
- Krabbameinsskrá (frá 1943)
- Dánarorsaka-skrá (frá 1970)
- Greiningar í heilsugæslu (frá 1990)
Þetta gerir danska heilbrigðisrannsókn mjög sterka. Það skapar einnig áhættu. Að fjarlægja hráa auðkennið er ekki nóg. Gagnasafn sem geymir enn aldur, kyn, greiningu og ár getur enduruppgötvað fólk — sérstaklega þá með sjaldgæfar sjúkdómar.
Leiðbeiningar Datatilsynet 2024 um aukanotkunar heilbrigðisgagna setja þrjár kröfur.
Skráðu hvað þú gerðir við gögnin: Lýstu hvaða reiti þú fjarlægðir, hvaða þú slefaðir eða flokkaðir og hvaða hópsstærð framleiðslan nær. Stefnuskrá uppfyllir ekki þennan staðal.
Fáðu ytri endurskoðun fyrir stór söfn: Fyrir gagnasöfn með yfir 5.000 manns mælir stofnunin með sjálfstæðri tæknilegri endurskoðun á aðgreiningarskrefunum.
Passar gögnin við spurninguna: Gagnasafnið verður að henta fram sett rannsóknarmarkmið. Stofnunin fann dæmi þar sem teymi notuðu full þjóðleg skráarsöfn þegar minni úrtak hefði dugað.
Sjá ESB-þjóðlegar auðkennis uppgötvunarleiðbeiningar okkar til að sjá hvernig athugunartalnareglur gilda um aðrar evrópska auðkennasnið.
Hvað 2024-málin Fundu
Fjórtán heilbrigðismálin deila þremur algengum bilunarmátum.
Rannsóknargagnadeiling: Sjúkrahús sendir aðgreindan sjúklingagagnasafn til akademísks félaga til gervigreindarpróftöku. Safnið geymir fæðingardagshópa, greiningarkóða og meðferðardagsetningar. Stofnunin kemst að þeirri niðurstöðu að þessi blöndun enduruppgötvi sjúklinga með sjaldgæfar sjúkdómar. Óvenjulegar greiningar þrengja hópinn hratt.
Þriðja-flokks gervigreindaþjónusta: Heilsutæknifyrirtæki sendir sjúklingaathugsemdir til bandarísks gervigreindarþjónustu til vinnslu klíniskar skrár. Persónuleg auðkenni í þeim athugasemdum eru ekki fjarlægð fyrst. Engin gild flutningstækni er til staðar.
OCR-leiðslubrestur: Tryggingafyrirtæki vinnur úr skönnuðum PDF-eyðublöðum fyrir örorku-kröfur. OCR-verkfæri þess breytir myndum í texta. En það keyrir ekki athugunartalaprófanir á framleiðslunni. Mörg auðkenni eru liðin hjá.
OCR setur oft bil í miðnúmer eða flytur yfir bandstrikið. Einföld myndauppgötvun brotnar á þessari framleiðslu. Uppgötvun verður að virka á OCR-texta, ekki bara hreinar inntök. Sjá OCR heilbrigðisuppgötvunarleiðbeiningar okkar til að fá skref til að meðhöndla skönnuð skjöl.
Þrjár Tæknilegar Nauðsynjar
Þessir þrír þættir mynda grunninn fyrir danskt heilbrigðis-GDPR-samræmi.
Athugunartalaprófanir á öllum texta: Keyrðu alla modulus-11 athugunina á hverjum frambjóðandastreng. Notaðu hana á hreinn texta og OCR-framleiðslu bæði.
Danskukynntur nafnauppgötvun: Notaðu líkan þjálfað á dönskum texta. spaCy da_core_news líkanið er einn kostur. Almennt enskt líkan missir dönsk nöfn og skipulagsheiti.
Aðgreiningarkrár: Skráðu hvað var fjarlægt, hvað var flokkað og hópsstærð framleiðslunnar. Stofnunin biður um þetta í tæknilegri mynd, ekki sem stefnuskrá.
Til að fá gögn um kostnað heilbrigðisgagnabrot, sjá heilbrigðisbrotakostnaðargreiningu okkar.