นอกเหนือจาก SSN และที่อยู่อีเมล: การทำข้อมูลนิรนามตัวระบุแบบกำหนดเองขององค์กรคุณ

เครื่องมือทำข้อมูลนิรนาม GDPR ของคุณตรวจจับที่อยู่อีเมล ตรวจจับหมายเลขโทรศัพท์ ตรวจจับชื่อและหมายเลขประกันสังคม คุณรัน export support ticket ผ่านมัน ดาวน์โหลดผลลัพธ์ที่ทำข้อมูลนิรนามแล้ว และแชร์กับทีมวิเคราะห์

หมายเลขบัญชีลูกค้าของคุณ (รูปแบบ ACC-XXXXXXXX-XX) ยังคงอยู่ใน ticket ทุกใบ รหัสคำสั่งซื้อ (ORD-XXXXXXX) ของคุณยังคงอยู่ รหัสผู้ใช้ภายในของคุณยังคงอยู่ที่นั่น

ตัวระบุเหล่านี้เป็น pseudonymous แบบแยกส่วน — ไม่ได้ระบุบุคคลโดยตรงโดยไม่มีการเข้าถึง lookup table แต่ทีมวิเคราะห์ของคุณมีการเข้าถึง lookup table นั้น ฐานข้อมูล support ของคุณมี CRM ของคุณมี Export ที่ทำข้อมูลนิรนามแล้วสามารถระบุตัวตนซ้ำได้ในไม่กี่วินาทีโดยทุกคนที่มีการเข้าถึงระบบใดๆ เหล่านี้

นี่คือความล้มเหลวของ GDPR pseudonymization — ไม่ใช่เพราะเครื่องมือพลาด PII มาตรฐาน แต่เพราะมันไม่รู้เกี่ยวกับตัวระบุเฉพาะองค์กรของคุณ

สิ่งที่เครื่องมือ PII มาตรฐานตรวจจับ

ครอบคลุม:

หมายเลขประกันสังคม (US SSN, UK NINO, รูปแบบ ID ระดับชาติของ EU)
ที่อยู่อีเมล (รูปแบบ RFC 5322)
หมายเลขโทรศัพท์ (E.164 และรูปแบบระดับชาติ)
หมายเลขบัตรเครดิต (การตรวจสอบอัลกอริทึม Luhn)
ชื่อ (การตรวจจับตาม NER model)
หมายเลขหนังสือเดินทาง/ใบอนุญาตขับขี่ (รูปแบบเฉพาะประเทศ)

ไม่ครอบคลุม:

รูปแบบรหัสพนักงานของคุณ (EMP-XXXXX)
รูปแบบหมายเลขบัญชีลูกค้าของคุณ (ACC-XXXXXXXX-XX)
รูปแบบรหัสคำสั่งซื้อของคุณ (ORD-XXXXXXX)
รหัสผู้ใช้ภายในของคุณ (UUID หรือรูปแบบกำหนดเอง)

ความเสี่ยงการระบุตัวตนซ้ำในทางปฏิบัติ

บริษัทบริการทางการเงินประมวลผล support tickets ของลูกค้าเพื่อการวิเคราะห์คุณภาพ กระบวนการทำข้อมูลนิรนาม PII มาตรฐานลบออก:

ชื่อลูกค้า ✓
ที่อยู่อีเมล ✓
หมายเลขโทรศัพท์ ✓
หมายเลขบัญชี (รูปแบบ ACC-XXXXXXXX-XX) ✗ — ไม่ตรวจจับ

Export ticket ส่งไปยังทีมวิเคราะห์ นักวิเคราะห์ข้อมูล join ตาราง ticket กับฐานข้อมูลลูกค้าบนหมายเลขบัญชี การระบุตัวตนซ้ำเป็นไปทันทีและสมบูรณ์

มาตรา 4(5) GDPR กำหนด pseudonymization ว่า "การประมวลผลข้อมูลส่วนบุคคลในลักษณะที่ข้อมูลส่วนบุคคลไม่สามารถเชื่อมโยงกับเจ้าของข้อมูลเฉพาะรายได้อีกต่อไปโดยไม่ใช้ข้อมูลเพิ่มเติม" หมายเลขบัญชีล้มเหลวการทดสอบนี้เมื่อข้อมูลเพิ่มเติม (ฐานข้อมูลลูกค้า) พร้อมใช้งาน

การสร้าง Custom Entity Patterns

ขั้นตอนที่ 1: ระบุรูปแบบตัวระบุ บันทึกตัวระบุเฉพาะองค์กรและรูปแบบของคุณ:

บัญชีลูกค้า: ACC-XXXXXXXX-XX
รหัสคำสั่งซื้อ: ORD-XXXXXXX
รหัสพนักงาน: EMP-XXXXX

ขั้นตอนที่ 2: สร้าง detection pattern อธิบายรูปแบบด้วยภาษาธรรมดา: "หมายเลขบัญชีที่ขึ้นต้นด้วย ACC แล้วขีด แล้ว 8 หลัก แล้วขีด แล้ว 2 ตัวอักษรพิมพ์ใหญ่"

AI-assisted pattern generation ให้: ACC-\d{8}-[A-Z]{2}

ขั้นตอนที่ 3: ตรวจสอบกับข้อมูลตัวอย่าง อัปโหลดเอกสาร 20-30 รายการที่มีตัวระบุ ยืนยัน:

ตรวจจับทุก instance ได้ (ไม่มี false negatives)
ไม่มี false positives

ขั้นตอนที่ 4: กำหนดค่าวิธีการทำข้อมูลนิรนาม สำหรับตัวระบุที่ใช้เป็น join keys:

Pseudonymize: แทนที่ ACC-00123456-AB ด้วย ACC-99876543-XY อย่างสม่ำเสมอ การแทนที่สม่ำเสมอ — input เดียวกันให้ output เดียวกันเสมอ — ดังนั้น analytical joins ยังคงทำงานได้

สำหรับตัวระบุที่ไม่จำเป็นสำหรับการวิเคราะห์:

Redact: แทนที่ด้วย [REDACTED]

ขั้นตอนที่ 5: บันทึกเป็น preset Custom entity ที่บันทึกเป็น team preset ใช้บังคับอย่างสม่ำเสมอทั่วการประมวลผลทั้งหมด

กรณีศึกษา: 180,000 Support Tickets

บริษัทบริการทางการเงินมีหมายเลขบัญชีลูกค้า (รูปแบบ ACC-XXXXXXXX-XX) ปรากฏอยู่ใน support ticket export ประวัติศาสตร์ เครื่องมือ PII มาตรฐานพลาดทั้งหมด

ช่องว่างที่ระบุ: หลังจากการตรวจสอบการปฏิบัติตาม ทีมตระหนักว่า support tickets ประวัติศาสตร์ 180,000 รายการใน analytics warehouse มีหมายเลขบัญชีที่ไม่ได้ปิดบัง

กำหนดเวลาแก้ไข:

เจ้าหน้าที่ปฏิบัติตามกำหนด ACC pattern (15 นาที)
ทดสอบกับ tickets ตัวอย่าง 30 รายการ (20 นาที)
ยืนยันความแม่นยำของ pattern (10 นาที)
ประมวลผล 180,000 tickets ใน overnight batch
แทนที่ตารางใน warehouse ด้วยเวอร์ชันที่ทำข้อมูลนิรนามใหม่

เวลารวมในการปิดช่องว่างการปฏิบัติตาม: 45 นาทีของเวลาเจ้าหน้าที่ปฏิบัติตาม + overnight batch

สรุป

ช่องว่างการตรวจจับ PII มาตรฐานไม่ใช่ข้อจำกัดทางเทคนิคของอัลกอริทึมการตรวจจับ — แต่เป็นช่องว่างการกำหนดค่า ไม่มีเครื่องมือตรวจจับใดรู้รูปแบบหมายเลขบัญชีขององค์กรคุณได้ เว้นแต่คุณจะบอก

การสร้าง custom entity ปิดช่องว่างนี้ในชั่วโมง ไม่ใช่สัปดาห์

แหล่งข้อมูล:

บทความที่เกี่ยวข้อง

GDPR & การปฏิบัติตาม

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

เริ่มทำให้ PII เป็นนิรนามด้วยประเภทเอนทิตีมากกว่า 285 ประเภทใน 48 ภาษา.

เริ่มทดลองใช้ฟรี ดูฟีเจอร์

นอกเหนือจาก SSN และอีเมล: การทำข้อมูลนิรนามตัวระบุองค์กรแบบกำหนดเอง

นอกเหนือจาก SSN และที่อยู่อีเมล: การทำข้อมูลนิรนามตัวระบุแบบกำหนดเองขององค์กรคุณ

สิ่งที่เครื่องมือ PII มาตรฐานตรวจจับ

ความเสี่ยงการระบุตัวตนซ้ำในทางปฏิบัติ

การสร้าง Custom Entity Patterns

กรณีศึกษา: 180,000 Support Tickets

สรุป

บทความที่เกี่ยวข้อง

Self-Hosted PII Fails Compliance Audits

Presidio Misses 220+ GDPR Entities

Configuration Drift: A Hidden GDPR Risk

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

นอกเหนือจาก SSN และอีเมล: การทำข้อมูลนิรนามตัวระบุองค์กรแบบกำหนดเอง

นอกเหนือจาก SSN และที่อยู่อีเมล: การทำข้อมูลนิรนามตัวระบุแบบกำหนดเองขององค์กรคุณ

สิ่งที่เครื่องมือ PII มาตรฐานตรวจจับ

ความเสี่ยงการระบุตัวตนซ้ำในทางปฏิบัติ

การสร้าง Custom Entity Patterns

กรณีศึกษา: 180,000 Support Tickets

สรุป

บทความที่เกี่ยวข้อง

Self-Hosted PII Fails Compliance Audits

Presidio Misses 220+ GDPR Entities

Configuration Drift: A Hidden GDPR Risk

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow