Nombor CPR Denmark: Panduan Pematuhan GDPR
Dikemas kini untuk 2026
Pengawas data Denmark, Datatilsynet, mengeluarkan 31 keputusan GDPR pada tahun 2024. Empat belas melibatkan data penjagaan kesihatan. Bahagian tinggi itu mencerminkan dua fakta: Denmark mengendalikan sistem kesihatan nasional yang besar, dan jurang teknikal dalam sistem itu terus mendedahkan rekod pesakit.
Peraturan Digit Semak untuk Nombor CPR
Nombor CPR ialah ID peribadi Denmark. Ia terdiri daripada 10 digit dalam format DDMMYY-XXXX. Enam digit pertama ialah tarikh lahir. Empat yang terakhir ialah kod ditambah digit semak.
Digit semak menggunakan peraturan modulus-11:
- Ambil digit 1 hingga 9.
- Berikan setiap satu pemberat: 4, 3, 2, 7, 6, 5, 4, 3, 2.
- Darabkan setiap digit dengan pemberat. Tambah semua hasil.
- Bahagi dengan 11. Perhatikan bakinya.
- Baki 0 → digit semak ialah 0.
- Baki 1 → nombor tidak sah.
- Baki 2-10 → digit semak ialah 11 tolak baki.
Peraturan ini penting untuk mana-mana alat yang mengimbas nombor CPR. Sesetengah rentetan DDMMYY-XXXX tidak mungkin sah. Alat yang melangkau langkah ini menandai tarikh, kod invois, dan nombor rujukan sebagai ID sebenar.
Semakan 2024 pihak berkuasa mendapati bahawa 67% alat NLP generik melangkau pemeriksaan ini. Jurang itu adalah kegagalan teknikal teratas dalam kes penjagaan kesihatannya.
Lima Daftar Kesihatan Denmark
Denmark menghubungkan data kesihatan merentasi lima daftar nasional. ID peribadi menghubungkan kelima-limanya.
- Rekod keluar hospital (dari 1977)
- Data preskripsi (dari 1995)
- Daftar kanser (dari 1943)
- Daftar punca kematian (dari 1970)
- Diagnosis penjagaan primer (dari 1990)
Ini menjadikan penyelidikan kesihatan Denmark sangat kukuh. Ia juga mewujudkan risiko. Mengeluarkan ID mentah tidak mencukupi. Set data yang masih menyimpan umur, jantina, diagnosis, dan tahun boleh mendedahkan semula orang — terutamanya mereka yang mengalami keadaan jarang.
Panduan 2024 Datatilsynet tentang penggunaan sekunder data kesihatan menetapkan tiga keperluan.
Tuliskan apa yang anda lakukan kepada data: Senaraikan medan yang anda buang, yang anda bulatkan atau kumpulkan, dan saiz kumpulan yang dicapai output. Nota polisi tidak memenuhi standard ini.
Dapatkan semakan luar untuk set besar: Bagi set data dengan lebih daripada 5,000 orang, pihak berkuasa mengesyorkan semakan teknikal bebas terhadap langkah penyahlengkapan.
Padankan data dengan soalan: Set data mesti sesuai dengan matlamat penyelidikan yang dinyatakan. Pihak berkuasa menemui kes di mana pasukan menggunakan daftar nasional penuh apabila sampel yang lebih kecil sudah mencukupi.
Lihat panduan pengesanan ID nasional EU kami untuk cara peraturan digit semak terpakai kepada format ID Eropah lain.
Apa yang Ditemui Kes 2024
Keempat belas kes penjagaan kesihatan berkongsi tiga jenis kegagalan biasa.
Perkongsian data penyelidikan: Hospital menghantar set data pesakit yang telah dinyahlengkap kepada rakan akademik untuk latihan AI. Set itu menyimpan bahagian tarikh lahir, kod diagnosis, dan tarikh rawatan. Pihak berkuasa mendapati gabungan ini mendedahkan semula pesakit dengan penyakit jarang. Diagnosis luar biasa mempersempit kumpulan dengan cepat.
Perkhidmatan AI pihak ketiga: Firma teknologi kesihatan menghantar nota pesakit kepada perkhidmatan AI berbasis AS untuk kerja rekod klinikal. ID peribadi dalam nota itu tidak dibuang terlebih dahulu. Tiada mekanisme pemindahan yang sah tersedia.
Jurang saluran OCR: Penginsurans memproses borang PDF yang diimbas untuk tuntutan kecacatan. Alat OCR-nya menukar imej kepada teks. Tetapi ia tidak menjalankan ujian digit semak pada output. Banyak ID terlepas.
OCR sering memasukkan ruang di tengah nombor atau mengalihkan sengkang. Padanan corak mudah gagal pada output tersebut. Pengesanan mesti berfungsi pada teks OCR, bukan hanya input bersih. Lihat panduan pengesanan OCR penjagaan kesihatan kami untuk langkah mengendalikan dokumen yang diimbas.
Tiga Keperluan Teknikal Wajib
Tiga elemen ini membentuk asas pematuhan GDPR penjagaan kesihatan Denmark.
Ujian digit semak pada semua teks: Jalankan pemeriksaan modulus-11 penuh pada setiap rentetan calon. Terapkan pada teks bersih dan output OCR.
Pengesanan nama berbahasa Denmark: Gunakan model yang dilatih pada teks Denmark. Model spaCy da_core_news ialah salah satu pilihan. Model Inggeris generik terlepas nama dan nama organisasi Denmark.
Rekod penyahlengkapan: Tuliskan apa yang dibuang, apa yang dikumpulkan, dan saiz kumpulan output. Pihak berkuasa meminta ini dalam bentuk teknikal, bukan sebagai nota polisi.
Untuk data mengenai kos insiden data penjagaan kesihatan, lihat analisis kos pelanggaran penjagaan kesihatan kami.