ช่องว่างการปฏิบัติตาม GDPR ที่ซ่อนอยู่
GDPR ไม่มีความชอบด้านภาษา มาตรา 4(1) กำหนด "ข้อมูลส่วนบุคคล" โดยไม่อ้างอิงภาษา แต่เครื่องมือตรวจจับ PII ส่วนใหญ่ถูกสร้างขึ้นสำหรับภาษาอังกฤษ
Identifier ระดับชาติที่เครื่องมือภาษาอังกฤษพลาด
| ประเทศ | Identifier | รูปแบบ |
|---|---|---|
| เยอรมนี | Steuer-ID | 11 หลัก |
| ฝรั่งเศส | NIR | 15 หลัก |
| สวีเดน | Personnummer | YYMMDD-XXXX |
| โปแลนด์ | PESEL | 11 หลัก + checksum |
| ไทย | บัตรประชาชน | 13 หลัก + checksum |
ความครอบคลุม 48 ภาษาของ anonym.legal
- โมเดล NER เฉพาะภาษาสำหรับทั้ง 48 ภาษา
- Pattern recognition สำหรับ national identifiers รวมถึง checksum
- รองรับเอกสารผสมภาษา
แหล่งที่มา: