العودة إلى المدونةتقني

خصوصية البيانات في منطقة آسيا والمحيط الهادئ...

وجدت شركة تكنولوجيا مالية في سنغافورة تعالج 500,000 محادثة دعم شهريًا عبر 12 لغة في منطقة آسيا والمحيط الهادئ أن أداتها التي تعتمد على اللغة...

March 24, 20267 دقيقة قراءة
APAC PII detectionThai PIIIndonesian data privacyVietnamese NERPDPA compliance

مشكلة لغة BPO

تعمل شركات تعهيد العمليات التجارية عبر الواقع متعدد اللغات لدعم العملاء في منطقة آسيا والمحيط الهادئ. عندما يتصل عميل في تايلاند بالدعم باللغة التايلاندية، عندما يكتب عميل إندونيسي باللغة الإندونيسية، عندما يستخدم عميل فيتنامي اللغة الفيتنامية — يتم إنشاء سجل المحادثة بتلك اللغة. وعندما يتم تحليل سجلات المحادثات هذه لضمان الجودة أو التدريب أو تدقيق الامتثال، فإن PII التي تحتوي عليها تكون بتلك اللغة.

لم تُبنى أدوات اكتشاف PII التي تركز على اللغة الإنجليزية لهذا البيئة. تم تدريب أدوات التعرف على الكيانات الخاصة بها على نصوص باللغة الإنجليزية. تعلمت نماذج اكتشاف الأسماء أنماط الأسماء باللغة الإنجليزية. تم تدريب اكتشاف العناوين على تنسيقات العناوين باللغة الإنجليزية.

عند تطبيقها على سجلات المحادثات التايلاندية أو الإندونيسية أو الفيتنامية، تنتج هذه الأدوات معدلات اكتشاف قريبة من الصفر لـ PII الخاصة باللغة. اسم عميل تايلاندي، مكتوب بخط تايلاندي، يكون غير مرئي لنموذج تعلم الأسماء من نصوص باللغة الإنجليزية. عنوان إندونيسي، يتبع تقاليد العنوان الإندونيسية، لا يتطابق مع الأنماط التي يتوقعها جهاز التعرف على العناوين المدرب على اللغة الإنجليزية.

المخاطر المتعلقة بالامتثال في منطقة آسيا والمحيط الهادئ

تخلق لوائح حماية البيانات عبر منطقة آسيا والمحيط الهادئ التزامات امتثال للمنظمات التي تعالج PII للعملاء:

قانون حماية البيانات الشخصية في تايلاند (PDPA): ساري المفعول منذ عام 2022، يفرض قانون PDPA في تايلاند متطلبات لتقليل البيانات، والموافقة، وتدابير الأمان على المنظمات التي تعالج البيانات الشخصية لمقيمي تايلاند. تسجل سجلات دعم العملاء التي تحتوي على أسماء وعناوين ومعلومات اتصال تايلاندية ضمن نطاق PDPA.

قانون حماية البيانات الشخصية في إندونيسيا: يخلق قانون حماية البيانات الشخصية الشامل في إندونيسيا التزامات للمنظمات التي تعالج البيانات الشخصية لمقيمي إندونيسيا، بما في ذلك متطلبات لتدابير الأمان المناسبة.

مرسوم حماية البيانات الشخصية في فيتنام (PDPD): يغطي إطار حماية البيانات الشخصية في فيتنام لعام 2023 معالجة البيانات الشخصية لمقيمي فيتنام من قبل المنظمات التي تعمل في أو تستهدف فيتنام.

بالنسبة لشركات BPO والمنظمات العالمية التي تخدم العملاء في منطقة آسيا والمحيط الهادئ، تخلق هذه اللوائح نفس المتطلبات الأساسية: يجب تحديد وحماية PII في بيانات العملاء بشكل مناسب. ينطبق هذا المتطلب بغض النظر عن اللغة التي استخدمها العميل.

مشكلة حجم المحادثات البالغ 500,000

تواجه شركة تكنولوجيا مالية مقرها سنغافورة تعالج 500,000 سجل محادثة دعم العملاء شهريًا عبر 12 لغة في منطقة آسيا والمحيط الهادئ تحديًا تشغيليًا محددًا: تغطي التزامات الامتثال الخاصة بها جميع التفاعلات البالغ عددها 500,000، لكن أداة اكتشاف PII الخاصة بها تغطي بدقة فقط مجموعة اللغة الإنجليزية.

إذا كانت 30% من التفاعلات باللغة الإنجليزية وحققت الأداة دقة اكتشاف بنسبة 90% لـ PII الإنجليزية، فإن الأداة تحمي بنجاح 135,000 تفاعل. تمر 365,000 تفاعل غير إنجليزي — تمثل بيانات العملاء التايلاندية والإندونيسية والفيتنامية والفلبينية والماليزية والكورية واليابانية ولغات أخرى — مع الحد الأدنى من اكتشاف PII.

الوضع الامتثالي: 73% من التفاعلات الشهرية غير محمية بشكل كافٍ، على الرغم من أن الالتزام بالامتثال يغطي جميع الـ 500,000.

المراجعة اليدوية لـ 365,000 تفاعل غير إنجليزي بمعدل مراجعة بشري معقول ليست قابلة للتطبيق من الناحية التشغيلية. تحتاج المنظمة إلى اكتشاف PII آلي يغطي مزيج لغاتها الفعلي، وليس فقط الإنجليزية.

ما الذي توفره الهندسة المعمارية متعددة اللغات

XLM-RoBERTa — نموذج محول متعدد اللغات تم تدريبه على نصوص من أكثر من 100 لغة — يوفر التعرف على الكيانات الذي يعمم عبر حدود اللغة. يتعلم نموذج تم تدريبه على مجموعات بيانات متعددة اللغات أن الأسماء والمواقع والمنظمات تشترك في أنماط هيكلية عبر اللغات، حتى عندما تختلف الأشكال السطحية تمامًا.

بالنسبة للغات منطقة آسيا والمحيط الهادئ:

  • الإندونيسية (ID): يوفر XLM-RoBERTa التعرف على الكيانات لأسماء الأشخاص والمنظمات والمواقع باللغة الإندونيسية
  • التايلاندية (TH): يوفر النقل متعدد اللغات من عائلات اللغات ذات الصلة اكتشاف PII أساسي
  • الفيتنامية (VI): التعرف على الكيانات مع الوعي باللغة النغمية
  • الفلبينية (TL): تغطية لتفاعلات العملاء باللغة التاجالوغية

بالإضافة إلى نماذج Stanza الخاصة باللغة للغات التي تتوفر لها نماذج مخصصة، يمدد النهج متعدد اللغات اكتشاف PII الآلي ليشمل المزيج الكامل للغات منطقة آسيا والمحيط الهادئ — وليس فقط مجموعة اللغة الإنجليزية.

بالنسبة لشركات BPO، فإن تأثير الامتثال قابل للقياس: بدلاً من حماية 27% من التفاعلات الشهرية، تغطي الاكتشافات متعددة اللغات الحجم الكامل. ينخفض عبء المراجعة اليدوية من 365,000 تفاعل إلى عينة لمراقبة الجودة.

المصادر:

هل أنت مستعد لحماية بياناتك؟

ابدأ بإخفاء المعلومات الشخصية مع أكثر من 285 نوع كيان عبر 48 لغة.