ปัญหา ML Training Data
GDPR มาตรา 5(1)(b) — Purpose Limitation: ไม่สามารถนำข้อมูลลูกค้าที่เก็บรวบรวมสำหรับ service delivery มาใช้ train ML model ได้โดยตรง
วิธีแก้ปัญหา GDPR-compliant:
- True anonymization (ออกจาก GDPR scope) — แต่ difficult
- Pseudonymization + consent — แต่ complexity สูง
- Synthetic data — แต่ต้องใช้ expertise
Batch Anonymization No-Code
- Export customer data เป็น CSV/Excel
- Upload ไปยัง batch processing tool
- เลือก preset ที่กำหนดโดย data team
- Process 10,000 records
- Download anonymized version
- ตรวจสอบ sample
- ใช้สำหรับ ML training
ความสม่ำเสมอสำหรับ Audit
Preset ที่บันทึกไว้สร้าง reproducibility: dataset ทุกชุดที่สร้างด้วย preset เดียวกันมี anonymization method เดียวกัน
แหล่งที่มา: