anonym.legal
กลับไปที่บล็อกGDPR & การปฏิบัติตาม

ทำไมเครื่องมือ PII แบบ Self-Hosted...

spaCy 3.4.4 ให้ผล NER ต่างจาก spaCy 3.5.1 บริษัทบริการทางการเงินพบว่า 3% ของเอกสารถูกทำให้ไม่ระบุตัวตนต่างกันใน staging และ production...

April 21, 20266 อ่านประมาณ
compliance auditenvironment consistencyspaCy versionsself-hosted PIIreproducible anonymization

ปัญหาความสม่ำเสมอ

การตั้งค่า Presidio ใน VM ต่างกัน ระบบปฏิบัติการต่าง Docker image เวอร์ชันต่าง หรือ Python environment ต่างอาจผลิตผล NER ที่แตกต่างกันสำหรับเอกสารเดียวกัน

สิ่งนี้สร้างปัญหา:

  • เอกสารเดียวกันอาจทำให้ไม่ระบุตัวตนต่างกันใน staging และ production
  • การอัปเดตทำให้การตรวจสอบเปรียบเทียบยาก
  • ผู้ตรวจสอบ GDPR ต้องการหลักฐานว่าการปฏิบัติสม่ำเสมอ

ทำไม SaaS แก้ปัญหานี้

โมเดลที่จัดการรักษา model version ที่สม่ำเสมอ การอัปเดตเป็นไปอย่างสม่ำเสมอในทุกผู้ใช้ และสภาพแวดล้อมเหมือนกันทั้งหมด

แหล่งที่มา:

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

เริ่มทำให้ PII เป็นนิรนามด้วยประเภทเอนทิตีมากกว่า 285 ประเภทใน 48 ภาษา.