anonym.legal
กลับไปที่บล็อกGDPR & การปฏิบัติตาม

ทำไมเครื่องมือตรวจจับ PII ของคุณจึงสอดคล้องกับ GDPR...

Steuer-ID ของเยอรมัน NIR ของฝรั่งเศส และ Personnummer ของสวีเดนต่างต้องการ logic การตรวจจับที่แตกต่างกัน เครื่องมือภาษาอังกฤษเท่านั้นพลาด PII 40-60%

March 3, 202610 อ่านประมาณ
multilingualGDPRNLPPII detectionEuropean compliancespaCyXLM-RoBERTa

ช่องว่างการปฏิบัติตาม GDPR ที่ซ่อนอยู่

GDPR ไม่มีความชอบด้านภาษา มาตรา 4(1) กำหนด "ข้อมูลส่วนบุคคล" โดยไม่อ้างอิงภาษา แต่เครื่องมือตรวจจับ PII ส่วนใหญ่ถูกสร้างขึ้นสำหรับภาษาอังกฤษ

Identifier ระดับชาติที่เครื่องมือภาษาอังกฤษพลาด

ประเทศIdentifierรูปแบบ
เยอรมนีSteuer-ID11 หลัก
ฝรั่งเศสNIR15 หลัก
สวีเดนPersonnummerYYMMDD-XXXX
โปแลนด์PESEL11 หลัก + checksum
ไทยบัตรประชาชน13 หลัก + checksum

ความครอบคลุม 48 ภาษาของ anonym.legal

  • โมเดล NER เฉพาะภาษาสำหรับทั้ง 48 ภาษา
  • Pattern recognition สำหรับ national identifiers รวมถึง checksum
  • รองรับเอกสารผสมภาษา

แหล่งที่มา:

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

เริ่มทำให้ PII เป็นนิรนามด้วยประเภทเอนทิตีมากกว่า 285 ประเภทใน 48 ภาษา.