BPO زبانی خلاء
APAC سپورٹ ٹیمیں بہت سی رسم الخط میں چیٹس سنبھالتی ہیں۔ تھائی صارف تھائی میں لکھتے ہیں۔ انڈونیشیائی صارف بہاسا میں لکھتے ہیں۔ ویتنامی صارف ویتنامی میں لکھتے ہیں۔
ان چیٹ لاگز میں PII ہوتی ہے۔ نام۔ فون نمبر۔ پتے۔ ID نمبر۔ سب مقامی رسم الخط میں۔
ایک زبانی ٹول یہاں ناکام رہتے ہیں۔ ان کے ماڈل مغربی متن پر تربیت یافتہ ہیں۔ نام تلاش کرنے والوں نے لاطینی رسم الخط کی نام کی شکلیں سیکھی ہیں۔ پتے کے ماڈل نے مغربی پتے کی ترتیب سیکھی ہے۔
تھائی رسم الخط ایک یک لسانی ماڈل کے لیے پوشیدہ ہے۔ ایک انڈونیشیائی پتہ لاطینی رسم الخط کے نمونوں سے میل نہیں کھاتا۔ ویتنامی سری دار متن ایک اور غیر میل کی تہہ شامل کرتا ہے۔ نتیجہ: غیر لاطینی لاگز کے لیے تقریباً صفر PII ہٹس۔
زیادہ تر APAC چیٹس انگریزی میں نہیں ہیں۔ یہ کوئی معمولی خلاء نہیں ہے۔ بڑے BPOs کے لیے، یہ معمول ہے۔
APAC میں تطابق کے داؤ
تین ڈیٹا قوانین اب ان خطوں کو ڈھانپتے ہیں۔ ہر ایک نافذ ہے۔ ہر ایک APAC گاہک ڈیٹا سنبھالنے والی BPO فرموں پر لاگو ہوتا ہے۔
تھائی لینڈ PDPA: 2022 سے فعال۔ ڈیٹا کم سے کم، رضامندی، اور سیکیورٹی کنٹرول کی ضرورت ہے۔ تھائی ناموں والے سپورٹ لاگ اس کے دائرے میں آتے ہیں۔
انڈونیشیا PDPLaw: ان تمام فرموں کو ڈھانپتا ہے جو رہائشیوں کا ڈیٹا پروسیس کرتی ہیں۔ ذاتی ریکارڈ کے لیے سیکیورٹی اقدامات ضروری ہیں۔
ویتنام PDPD: ویتنام کا 2023 کا حکم نامہ کسی بھی فرم پر لاگو ہوتا ہے جو ویتنامی رہائشیوں کا ڈیٹا سنبھالتی ہے۔ فرم کا مقام کوئی فرق نہیں پڑتا۔
تینوں ایک بنیادی اصول شیئر کرتے ہیں: PII تلاش کریں اور اسے محفوظ کریں۔ یہ اصول ہر اس رسم الخط میں لاگو ہوتا ہے جو گاہک استعمال کرتا ہے۔ BPO کام پر ان قوانین کے اثر کے لیے ہمارا تطابق جائزہ دیکھیں۔
500,000 چیٹ کا مسئلہ
ایک سنگاپور فن ٹیک ماہانہ 500,000 سپورٹ چیٹس چلاتا ہے۔ یہ 12 APAC بولیوں میں گاہکوں کی خدمت کرتا ہے۔ اس کی قانونی ذمہ داری تمام 500,000 کو ڈھانپتی ہے۔
اس کا صرف انگریزی ٹول صرف انگریزی حصہ ڈھانپتا ہے۔
فرض کریں 30% چیٹس انگریزی میں ہیں۔ فرض کریں وہاں درستگی 90% ہے۔ یہ تقریباً 135,000 چیٹس محفوظ کرتا ہے۔ باقی 365,000 تقریباً بغیر کسی PII کے گزر جاتی ہیں۔
اس سے 73% چیٹس غیر محفوظ رہتی ہیں۔ 365,000 چیٹس کا دستی جائزہ ممکن نہیں۔ صرف عملے کی لاگتیں اسے ناقابل عمل بناتی ہیں۔ خودکار ٹولز کو استعمال شدہ رسم الخط کے حقیقی مرکب کو ڈھانپنا چاہیے — صرف ایک کو نہیں۔
کراس لسانی ڈیٹیکشن
XLM-RoBERTa ایک ایسا ماڈل ہے جو 100 سے زائد زبانوں پر تربیت یافتہ ہے۔ یہ سیکھتا ہے کہ نام، مقامات، اور فرمیں مختلف رسم الخط میں نمونے شیئر کرتی ہیں۔ یہ اس وقت بھی کام کرتا ہے جب سطحی متن بالکل مختلف دکھے۔
APAC کوریج میں چار اہم رسم الخط شامل ہیں:
بہاسا انڈونیشیا — نام، فرمیں اور مقامات تلاش کرتا ہے۔ تھائی — کراس لسانی ٹرانسفر کے ذریعے بنیادی PII۔ ویتنامی — سری دار رسم الخط سپورٹ کے ساتھ ادارے کی ڈیٹیکشن۔ فلپائنی — تاگالوگ متن چیٹس کے لیے کوریج۔
Stanza ان رسم الخط کے لیے ماڈل شامل کرتا ہے جہاں وہ موجود ہیں۔ دو ٹول مل کر مکمل APAC مرکب کو ڈھانپتے ہیں۔ کسی کو بھی ہر رسم الخط کے لیے الگ ٹول کی ضرورت نہیں۔ ترتیب کے مراحل کے لیے ہماری سیکیورٹی گائیڈ دیکھیں۔
تطابق کا اثر واضح ہے۔ 27% چیٹس ڈھانپنے کی بجائے، مکمل کثیر لسانی ڈیٹیکشن ان سب کو ڈھانپتی ہے۔ دستی جائزے کی قطار لاکھوں سے کم ہو کر ایک چھوٹے اسپاٹ چیک تک آ جاتی ہے۔
یہ ابھی کیوں اہمیت رکھتا ہے
تھائی لینڈ PDPA، انڈونیشیا PDPLaw، اور ویتنام PDPD سب فعال ہیں۔ ریگولیٹر توقع رکھتے ہیں کہ فرمیں ہر اس رسم الخط میں PII تلاش کریں جو ان کے گاہک استعمال کرتے ہیں۔
یک لسانی ٹول اس معیار کو پورا نہیں کرتے۔ کراس لسانی ماڈل کرتے ہیں۔ وسیع APAC صارف آبادی والے BPOs کے لیے، خلاء اہمیت رکھتا ہے۔ یہ قانونی خطرے اور قانونی تحفظ کے درمیان کی لکیر ہے۔