ช่องว่างภาษาในงาน BPO
ทีมซัพพอร์ตเอเชียแปซิฟิกจัดการการสนทนาในหลายอักษร ผู้ใช้ไทยเขียนเป็นภาษาไทย ผู้ใช้อินโดนีเซียเขียนเป็น Bahasa ผู้ใช้เวียดนามเขียนเป็นภาษาเวียดนาม
บันทึกการสนทนาเหล่านั้นมี PII ชื่อ หมายเลขโทรศัพท์ ที่อยู่ หมายเลข ID ทั้งหมดในอักษรท้องถิ่น
เครื่องมือภาษาเดียวล้มเหลวที่นี่ โมเดลของมันฝึกด้วยข้อความตะวันตก ตัวหาชื่อเรียนรู้รูปแบบชื่ออักษรละติน โมเดลที่อยู่เรียนรู้รูปแบบที่อยู่ตะวันตก
อักษรไทยมองไม่เห็นสำหรับโมเดลที่ใช้ภาษาเดียว ที่อยู่อินโดนีเซียไม่ตรงกับรูปแบบอักษรละติน ข้อความภาษาเวียดนามที่มีวรรณยุกต์เพิ่มความไม่ตรงกันอีกชั้นหนึ่ง ผลลัพธ์: การตรวจ PII ใกล้ศูนย์สำหรับบันทึกที่ไม่ใช่อักษรละติน
การสนทนาเอเชียแปซิฟิกส่วนใหญ่ไม่ได้เป็นภาษาอังกฤษ นี่ไม่ใช่ช่องว่างเฉพาะกลุ่ม สำหรับ BPO ขนาดใหญ่ มันคือบรรทัดฐาน
ความสำคัญด้านการปฏิบัติตามกฎระเบียบในเอเชียแปซิฟิก
กฎหมายข้อมูลสามฉบับตอนนี้ครอบคลุมภูมิภาคเหล่านี้ แต่ละฉบับมีผลบังคับ แต่ละฉบับใช้กับบริษัท BPO ที่จัดการข้อมูลลูกค้าเอเชียแปซิฟิก
PDPA ไทย: มีผลใช้งานตั้งแต่ปี 2022 ต้องการการลดข้อมูลให้น้อยที่สุด ความยินยอม และการควบคุมความปลอดภัย บันทึกซัพพอร์ตที่มีชื่อไทยอยู่ในขอบเขตของมัน
PDPLaw ของอินโดนีเซีย: ครอบคลุมบริษัททั้งหมดที่ประมวลผลข้อมูลของผู้อยู่อาศัย ต้องการมาตรการความปลอดภัยสำหรับบันทึกส่วนบุคคล
PDPD ของเวียดนาม: พระราชกฤษฎีกาปี 2023 ของเวียดนามใช้กับบริษัทใดๆ ที่จัดการข้อมูลของผู้อยู่อาศัยในเวียดนาม ที่ตั้งของบริษัทไม่สำคัญ
ทั้งสามฉบับมีกฎหลักร่วมกันหนึ่งข้อ: หา PII และปกป้องมัน กฎนั้นใช้ในทุกอักษรที่ลูกค้าใช้ ดู ภาพรวมการปฏิบัติตาม ของเราสำหรับวิธีที่กฎหมายเหล่านี้ส่งผลต่องาน BPO
ปัญหาการสนทนา 500,000 ครั้ง
บริษัท fintech สิงคโปร์ดำเนินการสนทนาซัพพอร์ต 500,000 ครั้งต่อเดือน มันให้บริการลูกค้าในภาษาเอเชียแปซิฟิก 12 ภาษา หน้าที่ทางกฎหมายของมันครอบคลุมทั้ง 500,000 ครั้ง
เครื่องมือภาษาอังกฤษอย่างเดียวครอบคลุมส่วนภาษาอังกฤษเท่านั้น
สมมติว่า 30% ของการสนทนาเป็นภาษาอังกฤษ สมมติว่าความแม่นยำอยู่ที่ 90% ที่นั่น นั่นปกป้องการสนทนาประมาณ 135,000 ครั้ง อีก 365,000 ครั้งผ่านไปโดยแทบไม่มีการตรวจหา PII
นั่นทำให้ 73% ของการสนทนาไม่ได้รับการปกป้อง การ review ด้วยมือ 365,000 ครั้งนั้นทำไม่ได้ ต้นทุนพนักงานเพียงอย่างเดียวทำให้ไม่คุ้มค่า เครื่องมืออัตโนมัติต้องครอบคลุมส่วนผสมจริงของอักษรที่ใช้ — ไม่ใช่แค่อักษรเดียว
การตรวจจับข้ามภาษา
XLM-RoBERTa คือโมเดลที่ฝึกด้วยกว่า 100 ภาษา มันเรียนรู้ว่าชื่อ สถานที่ และบริษัทมีรูปแบบร่วมกันข้ามอักษร มันทำงานได้แม้ข้อความผิวเผินดูไม่เหมือนกันเลย
ความครอบคลุมเอเชียแปซิฟิกรวมสี่อักษรสำคัญ:
Bahasa Indonesia — หาชื่อ บริษัท และสถานที่ ไทย — PII พื้นฐานผ่านการถ่ายโอนข้ามภาษา เวียดนาม — การตรวจจับเอนทิตีพร้อมรองรับอักษรที่มีวรรณยุกต์ Filipino — ความครอบคลุมสำหรับการสนทนาข้อความภาษา Tagalog
Stanza เพิ่มโมเดลสำหรับอักษรที่มีอยู่ เครื่องมือทั้งสองร่วมกันครอบคลุมส่วนผสมเอเชียแปซิฟิกทั้งหมด ไม่มีเครื่องมือแยกต่างหากต่ออักษร ดู คู่มือความปลอดภัย ของเราสำหรับขั้นตอนการตั้งค่า
ผลกระทบด้านการปฏิบัติตามนั้นชัดเจน แทนที่จะครอบคลุม 27% ของการสนทนา การตรวจจับหลายภาษาเต็มรูปแบบครอบคลุมทั้งหมด คิวการ review ด้วยมือลดลงจากหลายแสนเป็นการตรวจสอบแบบสุ่มเล็กน้อย
เหตุใดจึงสำคัญตอนนี้
PDPA ของไทย PDPLaw ของอินโดนีเซีย และ PDPD ของเวียดนามล้วนมีผลบังคับ ผู้กำกับดูแลคาดหวังให้บริษัทหา PII ในทุกอักษรที่ลูกค้าใช้
เครื่องมือภาษาเดียวไม่บรรลุมาตรฐานนั้น โมเดลข้ามภาษาทำได้ สำหรับ BPO ที่มีฐานผู้ใช้เอเชียแปซิฟิกที่กว้าง ช่องว่างนั้นสำคัญ มันคือเส้นแบ่งระหว่างความเสี่ยงทางกฎหมายและความคุ้มครองทางกฎหมาย