หมายเลข CPR ของเดนมาร์ก: คู่มือการปฏิบัติตาม GDPR
อัปเดตสำหรับปี 2026
หน่วยงานกำกับดูแลข้อมูลของเดนมาร์ก Datatilsynet ออกคำตัดสิน GDPR 31 ฉบับในปี 2024 สิบสี่ฉบับเกี่ยวข้องกับข้อมูลด้านสุขภาพ อัตราส่วนที่สูงนั้นสะท้อนสองข้อเท็จจริง: เดนมาร์กดำเนินระบบสุขภาพแห่งชาติขนาดใหญ่ และช่องว่างทางเทคนิคในระบบนั้นยังคงเปิดเผยบันทึกผู้ป่วย
กฎหลักตรวจสอบสำหรับหมายเลข CPR
หมายเลข CPR คือ ID ส่วนบุคคลของเดนมาร์ก เป็น 10 หลักในรูปแบบ DDMMYY-XXXX หกหลักแรกคือวันเกิด สี่หลักสุดท้ายคือรหัสบวกหลักตรวจสอบ
หลักตรวจสอบใช้กฎ modulus-11:
- นำหลักที่ 1 ถึง 9
- ให้น้ำหนักแต่ละหลัก: 4, 3, 2, 7, 6, 5, 4, 3, 2
- คูณแต่ละหลักด้วยน้ำหนัก บวกผลลัพธ์ทั้งหมด
- หารด้วย 11 จดเศษ
- เศษ 0 → หลักตรวจสอบคือ 0
- เศษ 1 → หมายเลขไม่ถูกต้อง
- เศษ 2–10 → หลักตรวจสอบคือ 11 ลบเศษ
กฎนี้มีความสำคัญสำหรับเครื่องมือใดก็ตามที่สแกนหาหมายเลข CPR สตริง DDMMYY-XXXX บางอย่างไม่สามารถถูกต้องได้ เครื่องมือที่ข้ามขั้นตอนนี้ตั้งค่าสถานะวันที่ รหัสใบแจ้งหนี้ และหมายเลขอ้างอิงว่าเป็น ID จริง
การตรวจสอบปี 2024 ของหน่วยงานพบว่า 67% ของเครื่องมือ NLP ทั่วไปข้ามการตรวจสอบนี้ ช่องว่างนั้นคือความล้มเหลวทางเทคนิคอันดับต้นในคดีด้านสุขภาพของตน
ห้าทะเบียนสุขภาพของเดนมาร์ก
เดนมาร์กเชื่อมโยงข้อมูลสุขภาพข้ามห้าทะเบียนแห่งชาติ ID ส่วนบุคคลเชื่อมทั้งห้าเข้าด้วยกัน
- บันทึกการออกจากโรงพยาบาล (ตั้งแต่ปี 1977)
- ข้อมูลใบสั่งยา (ตั้งแต่ปี 1995)
- ทะเบียนมะเร็ง (ตั้งแต่ปี 1943)
- ทะเบียนสาเหตุการเสียชีวิต (ตั้งแต่ปี 1970)
- การวินิจฉัยการดูแลเบื้องต้น (ตั้งแต่ปี 1990)
สิ่งนี้ทำให้การวิจัยด้านสุขภาพของเดนมาร์กแข็งแกร่งมาก มันยังสร้างความเสี่ยง การลบ ID ดิบไม่เพียงพอ ชุดข้อมูลที่ยังมีอายุ เพศ การวินิจฉัย และปีสามารถเปิดเผยบุคคลใหม่ได้ — โดยเฉพาะผู้ที่มีภาวะหายาก
คำแนะนำปี 2024 ของ Datatilsynet เกี่ยวกับการใช้ข้อมูลสุขภาพรองกำหนดข้อกำหนดสาม
บันทึกสิ่งที่คุณทำกับข้อมูล: แสดงรายการฟิลด์ที่คุณลบ ฟิลด์ที่คุณปัดเศษหรือจัดกลุ่ม และขนาดกลุ่มที่ผลลัพธ์บรรลุ หมายเหตุนโยบายไม่ตรงตามมาตรฐานนี้
รับการตรวจสอบจากภายนอกสำหรับชุดข้อมูลขนาดใหญ่: สำหรับชุดข้อมูลที่มีมากกว่า 5,000 คน หน่วยงานแนะนำการตรวจสอบทางเทคนิคอิสระของขั้นตอนการลบตัวระบุ
จับคู่ข้อมูลกับคำถาม: ชุดข้อมูลต้องเหมาะสมกับเป้าหมายการวิจัยที่ระบุ หน่วยงานพบกรณีที่ทีมใช้ทะเบียนแห่งชาติทั้งหมดเมื่อตัวอย่างขนาดเล็กกว่าจะได้ผล
ดู คู่มือการตรวจจับ EU national ID ของเราสำหรับวิธีที่กฎหลักตรวจสอบใช้กับรูปแบบ ID ของยุโรปอื่นๆ
สิ่งที่คดีปี 2024 พบ
คดีด้านสุขภาพทั้ง 14 คดีมีประเภทความล้มเหลวทั่วไปสาม
การแบ่งปันข้อมูลการวิจัย: โรงพยาบาลส่งชุดข้อมูลผู้ป่วยที่ลบตัวระบุให้กับพันธมิตรทางวิชาการสำหรับการฝึก AI ชุดนั้นมีส่วนของวันเกิด รหัสการวินิจฉัย และวันที่การรักษา หน่วยงานพบว่าการผสมนี้เปิดเผยผู้ป่วยที่มีโรคหายาก การวินิจฉัยที่ผิดปกติจำกัดกลุ่มอย่างรวดเร็ว
บริการ AI ของบุคคลที่สาม: บริษัทเทคโนโลยีสุขภาพส่งบันทึกผู้ป่วยไปยังบริการ AI ที่ตั้งอยู่ในสหรัฐฯ สำหรับงานบันทึกทางคลินิก ID ส่วนบุคคลในบันทึกเหล่านั้นไม่ถูกลบออกก่อน ไม่มีกลไกการโอนที่ถูกต้อง
ช่องว่างไปป์ไลน์ OCR: บริษัทประกันประมวลผลแบบฟอร์ม PDF ที่สแกนสำหรับการเรียกร้องความพิการ เครื่องมือ OCR ของตนแปลงภาพเป็นข้อความ แต่ไม่รันการทดสอบหลักตรวจสอบบนผลลัพธ์ ID หลายรายการถูกพลาด
OCR มักแทรกช่องว่างกลางหมายเลขหรือเลื่อนเส้นประ การจับคู่รูปแบบง่ายๆ จะล้มเหลวกับผลลัพธ์นั้น การตรวจจับต้องทำงานกับข้อความ OCR ไม่ใช่แค่อินพุตที่สะอาด ดู คู่มือการตรวจจับ OCR ด้านสุขภาพ ของเราสำหรับขั้นตอนการจัดการเอกสารที่สแกน
สามสิ่งที่ต้องมีทางเทคนิค
สามองค์ประกอบนี้ประกอบเป็นพื้นฐานสำหรับการปฏิบัติตาม GDPR ด้านสุขภาพของเดนมาร์ก
การทดสอบหลักตรวจสอบกับข้อความทั้งหมด: รันการตรวจสอบ modulus-11 แบบเต็มกับสตริงผู้สมัครทุกอัน ใช้กับทั้งข้อความที่สะอาดและผลลัพธ์ OCR
การตรวจจับชื่อภาษาเดนมาร์ก: ใช้โมเดลที่ฝึกด้วยข้อความเดนมาร์ก โมเดล spaCy da_core_news เป็นตัวเลือกหนึ่ง โมเดลภาษาอังกฤษทั่วไปพลาดชื่อเดนมาร์กและชื่อองค์กร
บันทึกการลบตัวระบุ: บันทึกสิ่งที่ถูกลบ สิ่งที่ถูกจัดกลุ่ม และขนาดกลุ่มของผลลัพธ์ หน่วยงานขอสิ่งนี้ในรูปแบบทางเทคนิค ไม่ใช่เป็นหมายเหตุนโยบาย
สำหรับข้อมูลเกี่ยวกับต้นทุนของเหตุการณ์ข้อมูลด้านสุขภาพ ดู การวิเคราะห์ต้นทุนการละเมิดด้านสุขภาพ ของเรา