BPO Dil Problemi
İş Süreçleri Dış Kaynak Kullanımı (BPO) şirketleri, APAC müşteri desteğinin çok dilli gerçekliği içinde faaliyet göstermektedir. Tayland'daki bir müşteri destekle Tayca iletişime geçtiğinde, Endonezyalı bir müşteri Bahasa Endonezya'da yazdığında, Vietnamlı bir müşteri Vietnamca kullandığında — sohbet kaydı o dilde oluşturulur. Ve bu sohbet kayıtları kalite güvence, eğitim veya uyum denetimi için analiz edildiğinde, içerdiği PII o dilde bulunmaktadır.
İngilizce merkezli PII tespit araçları bu ortam için tasarlanmamıştır. Varlık tanıyıcıları İngilizce metinler üzerinde eğitilmiştir. İsim tespit modelleri İngilizce isim kalıplarını öğrenmiştir. Adres tespiti, İngilizce dilindeki adres formatları üzerinde eğitilmiştir.
Tayca, Endonezce veya Vietnamca sohbet kayıtlarına uygulandığında, bu araçlar dil spesifik PII için neredeyse sıfır tespit oranları üretmektedir. Tayca yazılmış bir Tay müşteri ismi, İngilizce metinlerden isimleri öğrenmiş bir model için görünmezdir. Endonezya adresi, Endonezya adresi kurallarına uygun olarak yazıldığında, İngilizce eğitilmiş bir adres tanıyıcısının beklediği kalıplarla eşleşmez.
APAC'taki Uyum Riskleri
APAC genelindeki veri koruma düzenlemeleri, müşteri PII'sini işleyen kuruluşlar için uyum yükümlülükleri oluşturur:
Tayland PDPA (Kişisel Veri Koruma Yasası): 2022'den beri yürürlükte olan Tayland PDPA, Tayland'daki sakinlerin kişisel verilerini işleyen kuruluşlar için veri minimizasyonu, onay ve güvenlik önlemleri gereklilikleri getirmektedir. Tayca isimler, adresler ve iletişim bilgilerini içeren müşteri destek kayıtları PDPA kapsamına girmektedir.
Endonezya PDPLaw: Endonezya'nın kapsamlı Kişisel Veri Koruma Yasası, Endonezyalı sakinlerin kişisel verilerini işleyen kuruluşlar için uygun güvenlik önlemleri gereklilikleri dahil olmak üzere yükümlülükler oluşturur.
Vietnam PDPD (Kişisel Veri Koruma Kararnamesi): Vietnam'ın 2023 kişisel veri koruma çerçevesi, Vietnam'da faaliyet gösteren veya Vietnam'ı hedefleyen kuruluşların Vietnamlı sakinlerin kişisel verilerini işlemelerini kapsamaktadır.
BPO şirketleri ve APAC müşterilerine hizmet veren küresel kuruluşlar için bu düzenlemeler aynı temel gerekliliği oluşturur: Müşteri verilerindeki PII tanımlanmalı ve uygun şekilde korunmalıdır. Bu gereklilik, müşterinin hangi dili kullandığına bakılmaksızın geçerlidir.
500.000 Sohbet Hacmi Problemi
12 APAC dilinde aylık 500.000 müşteri destek sohbet kaydı işleyen Singapur merkezli bir fintech, belirli bir operasyonel zorlukla karşı karşıyadır: uyum yükümlülükleri tüm 500.000 etkileşimi kapsar, ancak PII tespit aracı yalnızca İngilizce dilindeki alt küme için doğru bir şekilde kapsamaktadır.
Eğer etkileşimlerin %30'u İngilizce ise ve araç İngilizce PII için %90 tespit doğruluğu sağlıyorsa, araç 135.000 etkileşimi başarıyla korur. Geri kalan 365.000 İngilizce olmayan etkileşim — Tayca, Endonezce, Vietnamca, Filipince, Malayca, Korece, Japonca ve diğer dillerde müşteri verilerini temsil eden — minimal PII tespiti ile geçmektedir.
Uyum durumu: Aylık etkileşimlerin %73'ü yeterince korunmamaktadır, oysa uyum yükümlülüğü tüm 500.000'i kapsamaktadır.
Makul bir insan inceleme oranında 365.000 İngilizce olmayan etkileşimin manuel incelemesi operasyonel olarak mümkün değildir. Kuruluş, yalnızca İngilizce değil, gerçek dil karışımını kapsayan otomatik PII tespitine ihtiyaç duymaktadır.
Çapraz Dilli Mimari Ne Sağlar
XLM-RoBERTa — 100'den fazla dilden metin üzerinde eğitilmiş bir çapraz dilli dönüştürücü modeli — dil sınırları boyunca genelleştiren varlık tanıma sağlar. Çok dilli korpuslar üzerinde eğitilmiş bir model, isimlerin, yerlerin ve organizasyonların diller arasında yapısal kalıplar paylaştığını öğrenir, yüzey biçimleri tamamen farklı olsa bile.
APAC dilleri için:
- Endonezce (ID): XLM-RoBERTa, Bahasa Endonezya'da kişi isimleri, organizasyonlar ve yerler için varlık tanıma sağlar
- Tayca (TH): İlgili dil ailelerinden çapraz dilli transfer, temel PII tespiti sağlar
- Vietnamca (VI): Tonlu dil farkındalığı ile varlık tanıma
- Filipince (TL): Tagalog dilindeki müşteri etkileşimleri için kapsama
Özel modellerin mevcut olduğu diller için dil spesifik Stanza modelleri ile birleştirildiğinde, çapraz dilli yaklaşım, otomatik PII tespitini tam APAC dil karışımına genişletir — yalnızca İngilizce alt kümesine değil.
BPO'lar için uyumun etkisi ölçülebilir: Aylık etkileşimlerin %27'sini korumak yerine, kapsamlı çok dilli tespit tüm hacmi kapsar. Manuel inceleme yükü 365.000 etkileşimden kalite kontrol örneğine düşer.
Kaynaklar: