อัปเดตสำหรับปี 2026

หน่วยงานกำกับดูแลข้อมูลของเดนมาร์ก Datatilsynet ออกคำตัดสิน GDPR 31 ฉบับในปี 2024 สิบสี่ฉบับเกี่ยวข้องกับข้อมูลด้านสุขภาพ อัตราส่วนที่สูงนั้นสะท้อนสองข้อเท็จจริง: เดนมาร์กดำเนินระบบสุขภาพแห่งชาติขนาดใหญ่ และช่องว่างทางเทคนิคในระบบนั้นยังคงเปิดเผยบันทึกผู้ป่วย

กฎหลักตรวจสอบสำหรับหมายเลข CPR

หมายเลข CPR คือ ID ส่วนบุคคลของเดนมาร์ก เป็น 10 หลักในรูปแบบ DDMMYY-XXXX หกหลักแรกคือวันเกิด สี่หลักสุดท้ายคือรหัสบวกหลักตรวจสอบ

หลักตรวจสอบใช้กฎ modulus-11:

นำหลักที่ 1 ถึง 9
ให้น้ำหนักแต่ละหลัก: 4, 3, 2, 7, 6, 5, 4, 3, 2
คูณแต่ละหลักด้วยน้ำหนัก บวกผลลัพธ์ทั้งหมด
หารด้วย 11 จดเศษ
เศษ 0 → หลักตรวจสอบคือ 0
เศษ 1 → หมายเลขไม่ถูกต้อง
เศษ 2–10 → หลักตรวจสอบคือ 11 ลบเศษ

กฎนี้มีความสำคัญสำหรับเครื่องมือใดก็ตามที่สแกนหาหมายเลข CPR สตริง DDMMYY-XXXX บางอย่างไม่สามารถถูกต้องได้ เครื่องมือที่ข้ามขั้นตอนนี้ตั้งค่าสถานะวันที่ รหัสใบแจ้งหนี้ และหมายเลขอ้างอิงว่าเป็น ID จริง

การตรวจสอบปี 2024 ของหน่วยงานพบว่า 67% ของเครื่องมือ NLP ทั่วไปข้ามการตรวจสอบนี้ ช่องว่างนั้นคือความล้มเหลวทางเทคนิคอันดับต้นในคดีด้านสุขภาพของตน

ห้าทะเบียนสุขภาพของเดนมาร์ก

เดนมาร์กเชื่อมโยงข้อมูลสุขภาพข้ามห้าทะเบียนแห่งชาติ ID ส่วนบุคคลเชื่อมทั้งห้าเข้าด้วยกัน

บันทึกการออกจากโรงพยาบาล (ตั้งแต่ปี 1977)
ข้อมูลใบสั่งยา (ตั้งแต่ปี 1995)
ทะเบียนมะเร็ง (ตั้งแต่ปี 1943)
ทะเบียนสาเหตุการเสียชีวิต (ตั้งแต่ปี 1970)
การวินิจฉัยการดูแลเบื้องต้น (ตั้งแต่ปี 1990)

สิ่งนี้ทำให้การวิจัยด้านสุขภาพของเดนมาร์กแข็งแกร่งมาก มันยังสร้างความเสี่ยง การลบ ID ดิบไม่เพียงพอ ชุดข้อมูลที่ยังมีอายุ เพศ การวินิจฉัย และปีสามารถเปิดเผยบุคคลใหม่ได้ — โดยเฉพาะผู้ที่มีภาวะหายาก

คำแนะนำปี 2024 ของ Datatilsynet เกี่ยวกับการใช้ข้อมูลสุขภาพรองกำหนดข้อกำหนดสาม

บันทึกสิ่งที่คุณทำกับข้อมูล: แสดงรายการฟิลด์ที่คุณลบ ฟิลด์ที่คุณปัดเศษหรือจัดกลุ่ม และขนาดกลุ่มที่ผลลัพธ์บรรลุ หมายเหตุนโยบายไม่ตรงตามมาตรฐานนี้

รับการตรวจสอบจากภายนอกสำหรับชุดข้อมูลขนาดใหญ่: สำหรับชุดข้อมูลที่มีมากกว่า 5,000 คน หน่วยงานแนะนำการตรวจสอบทางเทคนิคอิสระของขั้นตอนการลบตัวระบุ

จับคู่ข้อมูลกับคำถาม: ชุดข้อมูลต้องเหมาะสมกับเป้าหมายการวิจัยที่ระบุ หน่วยงานพบกรณีที่ทีมใช้ทะเบียนแห่งชาติทั้งหมดเมื่อตัวอย่างขนาดเล็กกว่าจะได้ผล

ดู คู่มือการตรวจจับ EU national ID ของเราสำหรับวิธีที่กฎหลักตรวจสอบใช้กับรูปแบบ ID ของยุโรปอื่นๆ

สิ่งที่คดีปี 2024 พบ

คดีด้านสุขภาพทั้ง 14 คดีมีประเภทความล้มเหลวทั่วไปสาม

การแบ่งปันข้อมูลการวิจัย: โรงพยาบาลส่งชุดข้อมูลผู้ป่วยที่ลบตัวระบุให้กับพันธมิตรทางวิชาการสำหรับการฝึก AI ชุดนั้นมีส่วนของวันเกิด รหัสการวินิจฉัย และวันที่การรักษา หน่วยงานพบว่าการผสมนี้เปิดเผยผู้ป่วยที่มีโรคหายาก การวินิจฉัยที่ผิดปกติจำกัดกลุ่มอย่างรวดเร็ว

บริการ AI ของบุคคลที่สาม: บริษัทเทคโนโลยีสุขภาพส่งบันทึกผู้ป่วยไปยังบริการ AI ที่ตั้งอยู่ในสหรัฐฯ สำหรับงานบันทึกทางคลินิก ID ส่วนบุคคลในบันทึกเหล่านั้นไม่ถูกลบออกก่อน ไม่มีกลไกการโอนที่ถูกต้อง

ช่องว่างไปป์ไลน์ OCR: บริษัทประกันประมวลผลแบบฟอร์ม PDF ที่สแกนสำหรับการเรียกร้องความพิการ เครื่องมือ OCR ของตนแปลงภาพเป็นข้อความ แต่ไม่รันการทดสอบหลักตรวจสอบบนผลลัพธ์ ID หลายรายการถูกพลาด

OCR มักแทรกช่องว่างกลางหมายเลขหรือเลื่อนเส้นประ การจับคู่รูปแบบง่ายๆ จะล้มเหลวกับผลลัพธ์นั้น การตรวจจับต้องทำงานกับข้อความ OCR ไม่ใช่แค่อินพุตที่สะอาด ดู คู่มือการตรวจจับ OCR ด้านสุขภาพ ของเราสำหรับขั้นตอนการจัดการเอกสารที่สแกน

สามสิ่งที่ต้องมีทางเทคนิค

สามองค์ประกอบนี้ประกอบเป็นพื้นฐานสำหรับการปฏิบัติตาม GDPR ด้านสุขภาพของเดนมาร์ก

การทดสอบหลักตรวจสอบกับข้อความทั้งหมด: รันการตรวจสอบ modulus-11 แบบเต็มกับสตริงผู้สมัครทุกอัน ใช้กับทั้งข้อความที่สะอาดและผลลัพธ์ OCR

การตรวจจับชื่อภาษาเดนมาร์ก: ใช้โมเดลที่ฝึกด้วยข้อความเดนมาร์ก โมเดล spaCy da_core_news เป็นตัวเลือกหนึ่ง โมเดลภาษาอังกฤษทั่วไปพลาดชื่อเดนมาร์กและชื่อองค์กร

บันทึกการลบตัวระบุ: บันทึกสิ่งที่ถูกลบ สิ่งที่ถูกจัดกลุ่ม และขนาดกลุ่มของผลลัพธ์ หน่วยงานขอสิ่งนี้ในรูปแบบทางเทคนิค ไม่ใช่เป็นหมายเหตุนโยบาย

สำหรับข้อมูลเกี่ยวกับต้นทุนของเหตุการณ์ข้อมูลด้านสุขภาพ ดู การวิเคราะห์ต้นทุนการละเมิดด้านสุขภาพ ของเรา

แหล่งที่มา

บทความที่เกี่ยวข้อง

GDPR & การปฏิบัติตาม

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

เริ่มทำให้ PII เป็นนิรนามด้วยประเภทเอนทิตีมากกว่า 285 ประเภทใน 48 ภาษา.

เริ่มทดลองใช้ฟรี ดูฟีเจอร์

CPR ของเดนมาร์ก: การตรวจสอบ Modulus-11 สำหรับ GDPR

กฎหลักตรวจสอบสำหรับหมายเลข CPR

ห้าทะเบียนสุขภาพของเดนมาร์ก

สิ่งที่คดีปี 2024 พบ

สามสิ่งที่ต้องมีทางเทคนิค

แหล่งที่มา

บทความที่เกี่ยวข้อง

เครื่องมือ PII แบบ Self-Hosted ล้มเหลวในการตรวจสอบ Compliance

Presidio พลาด Entity GDPR กว่า 220 รายการ

Configuration Drift: ความเสี่ยง GDPR ที่ซ่อนอยู่

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

CPR ของเดนมาร์ก: การตรวจสอบ Modulus-11 สำหรับ GDPR

หมายเลข CPR ของเดนมาร์ก: คู่มือการปฏิบัติตาม GDPR

กฎหลักตรวจสอบสำหรับหมายเลข CPR

ห้าทะเบียนสุขภาพของเดนมาร์ก

สิ่งที่คดีปี 2024 พบ

สามสิ่งที่ต้องมีทางเทคนิค

แหล่งที่มา

บทความที่เกี่ยวข้อง

เครื่องมือ PII แบบ Self-Hosted ล้มเหลวในการตรวจสอบ Compliance

Presidio พลาด Entity GDPR กว่า 220 รายการ

Configuration Drift: ความเสี่ยง GDPR ที่ซ่อนอยู่

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow