A BPO nyelvi rése
Az APAC-os ügyfélszolgálati csapatok sok különböző írásrendszerben kapnak csevegéseket. A thai felhasználók thai nyelven írnak. Az indonéz felhasználók bahasán írnak. A vietnami felhasználók vietnamul írnak.
Ezek a csevegésnaplók PII-t tartalmaznak. Neveket. Telefonszámokat. Címeket. Azonosítószámokat. Mindezt helyi írásrendszerben.
Az egynyelvű eszközök itt megbuknak. Modelljeik nyugati szövegeken lettek betanítva. A névfelismerők latin írásos névformákat tanultak meg. A cím modellek nyugati cím-elrendezéseket tanultak meg.
A thai írásrendszer láthatatlan egy egynyelvű modell számára. Az indonéz cím nem illeszkedik a latin írásos mintákhoz. A vietnami tonális szöveg egy újabb eltérési réteget ad hozzá. Az eredmény: közel nulla PII-találat a nem latin írásos naplóknál.
Az APAC-os csevegések többsége nem angol nyelvű. Ez nem szélső eset. A nagy BPO-cégek számára ez a norma.
A megfelelőségi tét az APAC-ban
Három adatvédelmi törvény fedi le most ezeket a régiókat. Mindhárom hatályban van. Mindhárom vonatkozik az APAC-os ügyféladatokat kezelő BPO-cégekre.
Thaiföldi PDPA: 2022 óta hatályos. Adatminimalizálást, hozzájárulást és biztonsági ellenőrzéseket követel meg. A thai neveket tartalmazó ügyfélszolgálati naplók a hatálya alá esnek.
Indonéz PDPLaw: Minden olyan céget lefed, amely a rezidensek adatait dolgozza fel. Személyes rekordokhoz biztonsági intézkedéseket követel meg.
Vietnami PDPD: Vietnam 2023-as rendelete vonatkozik minden olyan cégre, amely vietnami rezidensek adatait kezeli. A cég helye nem számít.
Mindhárom egyetlen alapszabályt oszt: találja meg a PII-t és védje meg. Ez a szabály minden írásrendszerben érvényes, amelyet az ügyfél használ. Tekintse meg a megfelelőségi áttekintőnket arról, hogyan érintik ezek a törvények a BPO-munkát.
Az 500 000 csevegéses probléma
Egy szingapúri fintech havonta 500 000 ügyfélszolgálati csevegést dolgoz fel. 12 APAC-dialektusban szolgálja ki az ügyfeleket. A jogi kötelezettsége mind az 500 000-re kiterjed.
A csak angolt támogató eszköze csupán az angol részt fedi le.
Tegyük fel, hogy a csevegések 30%-a angolul van. Tegyük fel, hogy a pontosság 90%. Ez körülbelül 135 000 csevegést véd meg. A többi 365 000 szinte semennyi PII megtalálása nélkül halad át.
Ez a csevegések 73%-át hagyja védtelenül. 365 000 csevegés kézi felülvizsgálata nem megvalósítható. A személyzeti költségek önmagukban kivitelezhetetlenné teszik. Az automatizált eszközöknek a ténylegesen használt írásrendszerek teljes keverékét kell lefedniük — nem csak egyet.
Keresztnyelvű észlelés
Az XLM-RoBERTa egy 100 plusz nyelven betanított modell. Megtanulja, hogy a nevek, helyek és cégek mintákat osztanak az írásrendszerek között. Akkor is működik, ha a felszíni szöveg teljesen más.
Az APAC-lefedettség négy kulcsfontosságú írásrendszert foglal magában:
Bahasa Indonesia — neveket, cégeket és helyszíneket talál meg. Thai — alapszintű PII keresztnyelvű átvitellel. Vietnami — entitásfelismerés tonális írásrendszer-támogatással. Filippínó — lefedettség a tagalog szövegű csevegésekhez.
A Stanza modelleket ad azokhoz az írásrendszerekhez, ahol rendelkezésre állnak. A két eszköz együtt lefedi az egész APAC-keveréket. Egyikhez sem kell külön eszköz írásrendszerenként. Tekintse meg a biztonsági útmutatónkat a beállítási lépésekhez.
A megfelelőségi hatás egyértelmű. Ahelyett, hogy a csevegések 27%-át fedné le, a teljes többnyelvű észlelés mindegyiket lefedi. A kézi felülvizsgálati sor több százezresről kis mintaellenőrzésre csökken.
Miért fontos ez most
A thaiföldi PDPA, az indonéz PDPLaw és a vietnami PDPD mind hatályban vannak. A szabályozók elvárják, hogy a cégek minden írásrendszerben megtalálják a PII-t, amelyet ügyfeleik használnak.
Az egynyelvű eszközök nem felelnek meg ennek a mércének. A keresztnyelvű modellek igen. A széles APAC-felhasználói bázissal rendelkező BPO-cégek számára a rés számít. Ez a határ a jogi kockázat és a jogi védelem között.