Јазичниот јаз во BPO
Тимовите за поддршка во APAC ракуваат со разговори на многу пишувања. Тајландските корисници пишуваат на тајландски. Индонезиските корисници пишуваат на Бахаса. Виетнамските корисници пишуваат на виетнамски.
Тие дневници на разговори содржат ЛЛИ. Имиња. Телефонски броеви. Адреси. Броеви на документи за идентификација. Сè на локалното пишување.
Алатките за еден јазик тука не успеваат. Нивните модели биле обучени на западен текст. Пронаоѓачите на имиња научиле латинско-пишувани форми на имиња. Моделите за адреси научиле западни распореди на адреси.
Тајландското пишување е невидливо за еднојазичен модел. Индонезиска адреса не се совпаѓа со латинско-пишувани шаблони. Виетнамскиот тоналски текст додава уште еден слој на несовпаѓање. Резултатот: речиси нула пронаоѓање ЛЛИ за не-латинични дневници.
Повеќето разговори во APAC не се на англиски. Ова не е маргинален јаз. За големи BPO, тоа е норма.
Правни последици во APAC
Три закони за заштита на податоци сега ги покриваат овие региони. Секој е на сила. Секој се применува на BPO фирми кои ракуваат со APAC-податоци на клиентите.
Тајландски PDPA: Активен од 2022 година. Бара минимизирање на податоците, согласност и безбедносни контроли. Дневниците за поддршка со тајландски имиња спаѓаат под неговиот опфат.
Индонезиски PDPLaw: Ги покрива сите фирми кои обработуваат податоци на жители. Бара безбедносни мерки за лични записи.
Виетнамски PDPD: Декретот на Виетнам од 2023 година се применува на секоја фирма која ракува со податоци на виетнамски жители. Локацијата на фирмата нема значење.
Сите три споделуваат едно основно правило: пронајди ЛЛИ и заштити ги. Тоа правило важи на секое пишување кое го користи клиентот. Видете го нашиот Преглед на усогласеноста за тоа како овие закони влијаат на BPO работата.
Проблемот со 500.000 разговори
Компанија за финансиски технологии во Сингапур води 500.000 разговори за поддршка секој месец. Опслужува клиенти на 12 APAC дијалекти. Нејзината правна должност покрива сите 500.000.
Нејзината алатка само на англиски го покрива само делот на англиски.
Да речеме дека 30% од разговорите се на англиски. Да речеме дека точноста е 90% таму. Тоа заштитува околу 135.000 разговори. Останатите 365.000 поминуваат со речиси никакво пронаоѓање ЛЛИ.
Тоа остава 73% од разговорите незаштитени. Рачниот преглед на 365.000 разговори не е изводлив. Само трошоците за персоналот го прават тоа непрактично. Автоматизираните алатки мора да ја покријат вистинската мешавина на пишувања кои се користат - не само едно.
Меѓујазична детекција
XLM-RoBERTa е модел обучен на 100 и повеќе јазици. Учи дека имиња, места и фирми споделуваат шаблони низ пишувањата. Работи дури и кога површинскиот текст изгледа сосема различно.
Покриеноста на APAC вклучува четири клучни пишувања:
Бахаса Индонезија - наоѓа имиња, фирми и локации. Тајландски - основно ЛЛИ преку меѓујазичен пренос. Виетнамски - детекција на ентитети со поддршка за тоналско пишување. Филипински - покриеност за разговори на текст на тагалог.
Stanza додава модели за пишувања таму каде постојат. Двете алатки заедно ја покриваат целата мешавина на APAC. Ниту една не бара посебна алатка по пишување. Видете го нашиот безбедносен водич за чекорите за поставување.
Влијанието врз усогласеноста е јасно. Наместо да покрива 27% од разговорите, целосната мултијазична детекција ги покрива сите. Редот за рачен преглед паѓа од стотици илјади на мала spot-проверка.
Зошто тоа е важно сега
Тајландскиот PDPA, индонезискиот PDPLaw и виетнамскиот PDPD се сите активни. Регулаторите очекуваат фирмите да пронаоѓаат ЛЛИ на секое пишување кое го користат нивните клиенти.
Еднојазичните алатки не ја задоволуваат таа лента. Меѓујазичните модели ја задоволуваат. За BPO со широка APAC корисничка база, јазот е важен. Тоа е линијата меѓу правен ризик и правна покриеност.