ปัญหาแบบฟอร์มลายมือ
แม้ในยุค digital แบบฟอร์มลายมือยังคงแพร่หลายใน:
- ใบสมัครผู้ป่วยใหม่
- แบบฟอร์มความยินยอม
- บันทึกการนัดหมาย
- การเรียกร้องประกันภัย
แบบฟอร์มเหล่านี้มี PII จำนวนมาก: ชื่อ วันเกิด ที่อยู่ หมายเลขโทรศัพท์ และหมายเลขสุขภาพ
Pipeline: OCR + PII Detection
- Scan: แปลงแบบฟอร์มกายภาพเป็นภาพ
- OCR: แปลงภาพเป็น text (ความแม่นยำ 85-95% สำหรับลายมือที่ชัดเจน)
- PII Detection: ระบุและทำให้ PII ใน OCR output ไม่ระบุตัวตน
- Quality Review: ตรวจสอบ OCR errors ที่อาจส่งผลต่อ PII detection
ข้อจำกัด
- ลายมือที่ไม่ชัดอาจมีความแม่นยำ OCR ต่ำกว่า
- ต้องใช้ QC มนุษย์สำหรับ high-stakes documents
แหล่งที่มา: