Dikemas kini untuk 2026

Pengawas data Denmark, Datatilsynet, mengeluarkan 31 keputusan GDPR pada tahun 2024. Empat belas melibatkan data penjagaan kesihatan. Bahagian tinggi itu mencerminkan dua fakta: Denmark mengendalikan sistem kesihatan nasional yang besar, dan jurang teknikal dalam sistem itu terus mendedahkan rekod pesakit.

Peraturan Digit Semak untuk Nombor CPR

Nombor CPR ialah ID peribadi Denmark. Ia terdiri daripada 10 digit dalam format DDMMYY-XXXX. Enam digit pertama ialah tarikh lahir. Empat yang terakhir ialah kod ditambah digit semak.

Digit semak menggunakan peraturan modulus-11:

Ambil digit 1 hingga 9.
Berikan setiap satu pemberat: 4, 3, 2, 7, 6, 5, 4, 3, 2.
Darabkan setiap digit dengan pemberat. Tambah semua hasil.
Bahagi dengan 11. Perhatikan bakinya.
Baki 0 → digit semak ialah 0.
Baki 1 → nombor tidak sah.
Baki 2-10 → digit semak ialah 11 tolak baki.

Peraturan ini penting untuk mana-mana alat yang mengimbas nombor CPR. Sesetengah rentetan DDMMYY-XXXX tidak mungkin sah. Alat yang melangkau langkah ini menandai tarikh, kod invois, dan nombor rujukan sebagai ID sebenar.

Semakan 2024 pihak berkuasa mendapati bahawa 67% alat NLP generik melangkau pemeriksaan ini. Jurang itu adalah kegagalan teknikal teratas dalam kes penjagaan kesihatannya.

Lima Daftar Kesihatan Denmark

Denmark menghubungkan data kesihatan merentasi lima daftar nasional. ID peribadi menghubungkan kelima-limanya.

Rekod keluar hospital (dari 1977)
Data preskripsi (dari 1995)
Daftar kanser (dari 1943)
Daftar punca kematian (dari 1970)
Diagnosis penjagaan primer (dari 1990)

Ini menjadikan penyelidikan kesihatan Denmark sangat kukuh. Ia juga mewujudkan risiko. Mengeluarkan ID mentah tidak mencukupi. Set data yang masih menyimpan umur, jantina, diagnosis, dan tahun boleh mendedahkan semula orang — terutamanya mereka yang mengalami keadaan jarang.

Panduan 2024 Datatilsynet tentang penggunaan sekunder data kesihatan menetapkan tiga keperluan.

Tuliskan apa yang anda lakukan kepada data: Senaraikan medan yang anda buang, yang anda bulatkan atau kumpulkan, dan saiz kumpulan yang dicapai output. Nota polisi tidak memenuhi standard ini.

Dapatkan semakan luar untuk set besar: Bagi set data dengan lebih daripada 5,000 orang, pihak berkuasa mengesyorkan semakan teknikal bebas terhadap langkah penyahlengkapan.

Padankan data dengan soalan: Set data mesti sesuai dengan matlamat penyelidikan yang dinyatakan. Pihak berkuasa menemui kes di mana pasukan menggunakan daftar nasional penuh apabila sampel yang lebih kecil sudah mencukupi.

Lihat panduan pengesanan ID nasional EU kami untuk cara peraturan digit semak terpakai kepada format ID Eropah lain.

Apa yang Ditemui Kes 2024

Keempat belas kes penjagaan kesihatan berkongsi tiga jenis kegagalan biasa.

Perkongsian data penyelidikan: Hospital menghantar set data pesakit yang telah dinyahlengkap kepada rakan akademik untuk latihan AI. Set itu menyimpan bahagian tarikh lahir, kod diagnosis, dan tarikh rawatan. Pihak berkuasa mendapati gabungan ini mendedahkan semula pesakit dengan penyakit jarang. Diagnosis luar biasa mempersempit kumpulan dengan cepat.

Perkhidmatan AI pihak ketiga: Firma teknologi kesihatan menghantar nota pesakit kepada perkhidmatan AI berbasis AS untuk kerja rekod klinikal. ID peribadi dalam nota itu tidak dibuang terlebih dahulu. Tiada mekanisme pemindahan yang sah tersedia.

Jurang saluran OCR: Penginsurans memproses borang PDF yang diimbas untuk tuntutan kecacatan. Alat OCR-nya menukar imej kepada teks. Tetapi ia tidak menjalankan ujian digit semak pada output. Banyak ID terlepas.

OCR sering memasukkan ruang di tengah nombor atau mengalihkan sengkang. Padanan corak mudah gagal pada output tersebut. Pengesanan mesti berfungsi pada teks OCR, bukan hanya input bersih. Lihat panduan pengesanan OCR penjagaan kesihatan kami untuk langkah mengendalikan dokumen yang diimbas.

Tiga Keperluan Teknikal Wajib

Tiga elemen ini membentuk asas pematuhan GDPR penjagaan kesihatan Denmark.

Ujian digit semak pada semua teks: Jalankan pemeriksaan modulus-11 penuh pada setiap rentetan calon. Terapkan pada teks bersih dan output OCR.

Pengesanan nama berbahasa Denmark: Gunakan model yang dilatih pada teks Denmark. Model spaCy da_core_news ialah salah satu pilihan. Model Inggeris generik terlepas nama dan nama organisasi Denmark.

Rekod penyahlengkapan: Tuliskan apa yang dibuang, apa yang dikumpulkan, dan saiz kumpulan output. Pihak berkuasa meminta ini dalam bentuk teknikal, bukan sebagai nota polisi.

Untuk data mengenai kos insiden data penjagaan kesihatan, lihat analisis kos pelanggaran penjagaan kesihatan kami.

Sumber

Artikel Berkaitan

GDPR & Pematuhan

Sedia untuk melindungi data anda?

Mulakan pengenalan PII dengan 285+ jenis entiti dalam 48 bahasa.

Mulakan Percubaan Percuma Lihat Ciri-ciri

Denmark CPR: Pengesahan Modulus-11 untuk GDPR

Peraturan Digit Semak untuk Nombor CPR

Lima Daftar Kesihatan Denmark

Apa yang Ditemui Kes 2024

Tiga Keperluan Teknikal Wajib

Sumber

Artikel Berkaitan

PII Hos Sendiri Gagal Audit Pematuhan

Presidio Terlepas 220+ Entiti GDPR

Hanyutan Konfigurasi: Risiko GDPR yang Tersembunyi

Sedia untuk melindungi data anda?

Denmark CPR: Pengesahan Modulus-11 untuk GDPR

Nombor CPR Denmark: Panduan Pematuhan GDPR

Peraturan Digit Semak untuk Nombor CPR

Lima Daftar Kesihatan Denmark

Apa yang Ditemui Kes 2024

Tiga Keperluan Teknikal Wajib

Sumber

Artikel Berkaitan

PII Hos Sendiri Gagal Audit Pematuhan

Presidio Terlepas 220+ Entiti GDPR

Hanyutan Konfigurasi: Risiko GDPR yang Tersembunyi

Sedia untuk melindungi data anda?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow