ความเสี่ยงของการใช้เครื่องมือภาษาอังกฤษเท่านั้น
สำหรับบริษัทที่ดำเนินการในหลายประเทศ EU การใช้เครื่องมือตรวจจับ PII ที่ออกแบบมาสำหรับภาษาอังกฤษ สร้างความเสี่ยงจาก GDPR:
ตัวระบุที่พลาด:
- German Steuer-ID: 11 หลัก + checksum ที่ซ่อนอยู่ใน English regex patterns
- French NIR: 15 หลัก—ไม่เคยได้รับการสนใจในเครื่องมือของสหรัฐอเมริกา
- Swedish Personnummer: Luhn algorithm—เฉพาะ Swedish
- Polish PESEL: Checksum unique—ไม่ถูกรู้จักในไลบรารี่เปิดโลก
อัตราการตรวจจับ:
- English text: 85-92% (แล่น = ประมาณ 8-15% ข้อมูล PII ที่พลาด)
- German text: 45-55% (แล่น = 45-55% ข้อมูล PII ที่พลาด)
- French text: 50-60% (แล่น = 40-50% ข้อมูล PII ที่พลาด)
ความหมาย GDPR
ถ้าเครื่องมือของคุณ "ล้มเหลว" ตรวจจับ PII ของเยอรมันในเขต 50% ก่อนเผยแพร่ ลูกค้า 50% ของคุณมีความเสี่ยง