BPO भाषा समस्या
बिजनेस प्रोसेस आउटसोर्सिंग कंपनियाँ APAC ग्राहक समर्थन की बहुभाषी वास्तविकता में काम करती हैं। जब थाईलैंड में एक ग्राहक थाई में समर्थन से संपर्क करता है, जब एक इंडोनेशियाई ग्राहक बहासा इंडोनेशिया में लिखता है, जब एक वियतनामी ग्राहक वियतनामी का उपयोग करता है - चैट लॉग उसी भाषा में बनाया जाता है। और जब उन चैट लॉग का गुणवत्ता आश्वासन, प्रशिक्षण, या अनुपालन ऑडिटिंग के लिए विश्लेषण किया जाता है, तो उनमें मौजूद PII उसी भाषा में होता है।
अंग्रेजी-केंद्रित PII पहचान उपकरण इस वातावरण के लिए नहीं बने थे। उनके एंटिटी पहचानकर्ता अंग्रेजी पाठ पर प्रशिक्षित थे। उनके नाम पहचानने वाले मॉडल ने अंग्रेजी नाम पैटर्न सीखे। उनके पते की पहचान अंग्रेजी-भाषा पते के प्रारूप पर प्रशिक्षित थी।
थाई, इंडोनेशियाई, या वियतनामी चैट लॉग पर लागू होने पर, ये उपकरण भाषा-विशिष्ट PII के लिए लगभग शून्य पहचान दर उत्पन्न करते हैं। थाई ग्राहक का नाम, जो थाई लिपि में लिखा गया है, एक मॉडल के लिए अदृश्य है जिसने अंग्रेजी पाठ से नाम सीखे हैं। एक इंडोनेशियाई पता, जो इंडोनेशियाई पते के मानकों का पालन करता है, उस पैटर्न से मेल नहीं खाता जो एक अंग्रेजी-प्रशिक्षित पता पहचानकर्ता अपेक्षा करता है।
APAC में अनुपालन की दांव
APAC में डेटा सुरक्षा नियम संगठनों के लिए अनुपालन बाध्यताएँ उत्पन्न करते हैं जो ग्राहक PII को संसाधित करते हैं:
थाईलैंड PDPA (व्यक्तिगत डेटा संरक्षण अधिनियम): 2022 से प्रभावी, थाईलैंड का PDPA डेटा न्यूनतमकरण, सहमति, और सुरक्षा उपायों के लिए आवश्यकताएँ लागू करता है जो थाई निवासियों के व्यक्तिगत डेटा को संसाधित करने वाले संगठनों पर लागू होती हैं। ग्राहक समर्थन लॉग जिनमें थाई नाम, पते, और संपर्क जानकारी होती है, PDPA के दायरे में आती हैं।
इंडोनेशिया PDPLaw: इंडोनेशिया का व्यापक व्यक्तिगत डेटा संरक्षण कानून इंडोनेशियाई निवासियों के व्यक्तिगत डेटा को संसाधित करने वाले संगठनों के लिए बाध्यताएँ उत्पन्न करता है, जिसमें उचित सुरक्षा उपायों की आवश्यकताएँ शामिल हैं।
वियतनाम PDPD (व्यक्तिगत डेटा संरक्षण अधिनियम): वियतनाम का 2023 व्यक्तिगत डेटा संरक्षण ढांचा वियतनामी निवासियों के व्यक्तिगत डेटा को संसाधित करने वाले संगठनों पर लागू होता है।
BPO कंपनियों और APAC ग्राहकों को सेवा देने वाले वैश्विक संगठनों के लिए, ये नियम एक ही मौलिक आवश्यकता उत्पन्न करते हैं: ग्राहक डेटा में PII की पहचान की जानी चाहिए और उचित रूप से सुरक्षित किया जाना चाहिए। यह आवश्यकता इस बात पर निर्भर नहीं करती कि ग्राहक ने कौन सी भाषा का उपयोग किया।
500,000-चैट मात्रा समस्या
एक सिंगापुर स्थित फिनटेक जो 12 APAC भाषाओं में 500,000 ग्राहक समर्थन चैट लॉग को मासिक रूप से संसाधित करता है, एक विशिष्ट संचालन चुनौती का सामना करता है: उनकी अनुपालन बाध्यता सभी 500,000 इंटरैक्शन को कवर करती है, लेकिन उनका PII पहचान उपकरण केवल अंग्रेजी-भाषा उपसमुच्चय को सही ढंग से कवर करता है।
यदि 30% इंटरैक्शन अंग्रेजी में हैं और उपकरण अंग्रेजी PII के लिए 90% पहचान सटीकता प्राप्त करता है, तो उपकरण सफलतापूर्वक 135,000 इंटरैक्शन की सुरक्षा करता है। शेष 365,000 गैर-अंग्रेजी इंटरैक्शन - जो थाई, इंडोनेशियाई, वियतनामी, फिलिपिनो, मलय, कोरियाई, जापानी, और अन्य भाषा ग्राहक डेटा का प्रतिनिधित्व करते हैं - न्यूनतम PII पहचान के साथ गुजरते हैं।
अनुपालन स्थिति: 73% मासिक इंटरैक्शन उचित रूप से सुरक्षित नहीं हैं, भले ही अनुपालन बाध्यता सभी 500,000 को कवर करती हो।
365,000 गैर-अंग्रेजी इंटरैक्शन की मैनुअल समीक्षा किसी भी उचित मानव समीक्षा दर पर संचालन के लिए व्यवहार्य नहीं है। संगठन को स्वचालित PII पहचान की आवश्यकता है जो उनकी वास्तविक भाषा मिश्रण को कवर करे, केवल अंग्रेजी नहीं।
क्रॉस-लिंगुअल आर्किटेक्चर क्या प्रदान करता है
XLM-RoBERTa - एक क्रॉस-लिंगुअल ट्रांसफार्मर मॉडल जो 100+ भाषाओं के पाठ पर प्रशिक्षित है - एंटिटी पहचान प्रदान करता है जो भाषा सीमाओं के पार सामान्यीकृत होती है। एक मॉडल जो बहुभाषी कॉर्पोरा पर प्रशिक्षित है, यह सीखता है कि नाम, स्थान, और संगठन भाषाओं के बीच संरचनात्मक पैटर्न साझा करते हैं, भले ही सतही रूप पूरी तरह से भिन्न हों।
APAC भाषाओं के लिए:
- इंडोनेशियाई (ID): XLM-RoBERTa बहासा इंडोनेशिया में व्यक्ति नाम, संगठनों, और स्थानों के लिए एंटिटी पहचान प्रदान करता है
- थाई (TH): संबंधित भाषा परिवारों से क्रॉस-लिंगुअल ट्रांसफर आधारभूत PII पहचान प्रदान करता है
- वियतनामी (VI): टोनल भाषा जागरूकता के साथ एंटिटी पहचान
- फिलिपिनो (TL): तागालोग-भाषा ग्राहक इंटरैक्शन के लिए कवरेज
जहाँ समर्पित मॉडल उपलब्ध हैं, वहां भाषा-विशिष्ट स्टैंजा मॉडल के साथ मिलकर, क्रॉस-लिंगुअल दृष्टिकोण स्वचालित PII पहचान को पूरे APAC भाषा मिश्रण तक बढ़ाता है - केवल अंग्रेजी उपसमुच्चय नहीं।
BPOs के लिए, अनुपालन का प्रभाव मापनीय है: मासिक इंटरैक्शन के 27% की सुरक्षा करने के बजाय, व्यापक बहुभाषी पहचान पूरे मात्रा को कवर करती है। मैनुअल समीक्षा का बोझ 365,000 इंटरैक्शन से गुणवत्ता-नियंत्रण नमूने तक गिर जाता है।
स्रोत: