ปัญหา Binary Detection
ระบบ PII แบบ binary: "PERSON detected" or "no PERSON detected"
ปัญหา: ชื่อบางชื่อถูกต้องตามบริบท บางชื่อคลุมเครือ:
- "Apple" — บริษัทหรือผลไม้?
- "Smith" — นามสกุลหรือ profession?
- "John" — ชื่อหรือ common noun ในบางภาษา?
ระบบ binary ทำให้ไม่ระบุตัวตนทุกอย่างหรือไม่ทำอะไรเลย
ประโยชน์ของ Confidence Scoring
ด้วย confidence scores (0-1):
-
0.9: ทำให้ไม่ระบุตัวตนอัตโนมัติ
- 0.5-0.9: แสดงสำหรับการตรวจสอบ
- < 0.5: ข้าม (หรือแสดงเพื่อ review)
นักวิเคราะห์ compliance ตัดสินในกรณีที่คลุมเครือ
การประยุกต์ใช้ใน Legal และ Healthcare
ในบริบท legal: 'Smith & Jones' อาจเป็นชื่อทนายความหรือชื่อสำนักงาน Confidence score ช่วยให้มนุษย์ตัดสินใจ
แหล่งที่มา: