Jazyková medzera BPO
Podporné týmy APAC spracúvajú chaty v mnohych skriptoch. Thajskí uzívatelia písú po thajsky. Indonézski uzívatelia písú v jazyku Bahasa. Vietnamskí uzívatelia písú po vietnamsky.
Tieto protokoly chatov obsahujú PII. Mená. Telefónne císla. Adresy. ID císla. Vsetky v miestnom skripte.
Jednojazycné nástroje tu zlyhávajú. Ich modely boli trénované na západnom texte. Vyhladávace mien sa naucili latinskoabecedné formy mien. Modely adries sa naucili západné rozlozenia adries.
Thajsky skript je pre jednojazycný model neviditelný. Indonézska adresa nezodpovedá latinsko-abecedným vzorom. Vietnamský tonálny text pridáva ďalsiu vrstvu nezhody. Výsledok: takmer nula zásahov PII pre protokoly v nelatinskom skripte.
Väcsina chatov APAC nie je v anglictine. Toto nie je okrajová medzera. Pre velké BPO je to norma.
Súlad so zákonmi v oblasti APAC
Tri zákony o dátach teraz pokryvajú tieto regióny. Kazdy je v platnosti. Kazdy sa vzťahuje na firmy BPO spracúvajúce zákaznícke dáta APAC.
Thajský PDPA: Aktívny od roku 2022. Vyzaduje minimalizáciu dát, súhlas a bezpecnostné kontroly. Podporné protokoly s thajskymi menami spadajú do jeho rozsahu.
Indonézsky PDPLaw: Pokryvá vsetky firmy, ktore spracúvajú dáta obyvatelov. Vyzaduje bezpecnostné opatrenia pre osobné záznamy.
Vietnamský PDPD: Vietnamský dekrét z roku 2023 sa vzťahuje na kazdu firmu, ktora narába s dátami vietnamskych obyvatelov. Umiestnenie firmy nehrá rolu.
Vsetky tri zdielaju jedno hlavné pravidlo: nájdite PII a chránte ho. Toto pravidlo platí v kazdom skripte, ktory zákazník pouzíva. Pozrite si nás prehlad súladu pre to, ako tieto zákony ovplyvnujú prácu BPO.
Problem 500 000 chatov
Singapurský fintech spracúva 500 000 chatov podpory mesacne. Sluzi zákazníkom napriec 12 dialektmi APAC. Jeho právna povinnost pokryvá vsetkych 500 000.
Jeho nástroj iba v anglictine pokryvá iba anglickú cast.
Povedzme, ze 30 % chatov je v anglictine. Povedzme, ze presnosť je tam 90 %. To chráni priblizne 135 000 chatov. Zvysnych 365 000 prechádza s takmer ziadnym nájdenym PII.
To necháva 73 % chatov nechránených. Rucná kontrola 365 000 chatov nie je realizovatelná. Samotné náklady na personál to robia nepraktickym. Automatizované nástroje musia pokryt skutocnú zmes skriptov pouzívanych - nie iba jeden.
Mezijazycná detekcia
XLM-RoBERTa je model trénovaný na viac ako 100 jazykoch. Uci sa, ze mená, miesta a firmy zdielaju vzory napriec skriptami. Funguje aj ked povrchový text vyzera úplne odlisne.
Pokrytie APAC zahŕna styri klúcové skripty:
Bahasa Indonesia - nachádza mená, firmy a lokácie. Thajsky - základné PII prostredníctvom medzijayzného prenosu. Vietnamsky - detekcia entít s podporou tonálneho skriptu. Filipínsky - pokrytie pre chaty v tagalogskom texte.
Stanza pridáva modely pre skripty, kde existujú. Oba nástroje spolu pokryvajú úplnú zmes APAC. Ani jeden nevyzaduje samostatný nástroj pre kazdy skript. Pozrite si nás sprievodca bezpecnostou pre kroky nastavenia.
Dopad na súlad je jasny. Namiesto pokrytia 27 % chatov, úplná viacjazyná detekcia pokryvá vsetky. Rad na rucnú kontrolu klesá z státisícov na malú stochastickú vzorku.
Preco na tom teraz záleží
Thajský PDPA, indonézsky PDPLaw a vietnamský PDPD su vsetky aktívne. Regulátori ocakávajú, ze firmy nájdu PII v kazdom skripte, ktory ich zákazníci pouzívajú.
Jednojazycné nástroje túto latku nesplnajú. Medzijazyéné modely áno. Pre BPO so sirokou základnou uzívatelov APAC na tom záleží. Je to hranica medzi právnym rizikom a právnou ochranou.