BPO-kieliongelma
Liiketoimintaprosessien ulkoistamiseen (BPO) liittyvät yritykset toimivat APAC-asiakastuen monikielisessä todellisuudessa. Kun asiakas Thaimaassa ottaa yhteyttä tukeen thaiksi, kun indonesialainen asiakas kirjoittaa Bahasa Indonesiaksi, kun vietnamilainen asiakas käyttää vietnamin kieltä — keskusteluloki luodaan kyseisellä kielellä. Ja kun näitä keskustelulokeja analysoidaan laadunvarmistusta, koulutusta tai vaatimustenmukaisuuden tarkastusta varten, ne sisältävät PII:tä kyseisellä kielellä.
Englantiin keskittyneet PII-tunnistus työkalut eivät ole suunniteltu tähän ympäristöön. Niiden entiteettitunnistimet on koulutettu englanninkieliselle tekstille. Niiden nimitunnistusmallit ovat oppineet englanninkielisiä nimimalleja. Niiden osoitetunnistus on koulutettu englanninkielisten osoiteformaattien mukaan.
Sovellettaessa thaimaalaisiin, indonesialaisiin tai vietnamilaisiin keskustelulokeihin, nämä työkalut tuottavat lähes nollan tunnistustarkkuuden kielikohtaiselle PII:lle. Thaimaalaisen asiakkaan nimi, kirjoitettuna thaikielellä, on näkymätön mallille, joka on oppinut nimiä englanninkielisestä tekstistä. Indonesialainen osoite, joka noudattaa indonesialaisia osoitekonventioita, ei vastaa englanninkielisen osoitetunnistimen odottamia malleja.
Vaatimustenmukaisuuden Panokset APAC:ssa
Tietosuojalait APAC:ssa luovat vaatimustenmukaisuusvelvoitteita organisaatioille, jotka käsittelevät asiakkaidensa PII:tä:
Thaimaa PDPA (Henkilötietojen suojaamis laki): Voimassa vuodesta 2022, Thaimaan PDPA asettaa vaatimuksia tietojen minimoinnille, suostumukselle ja turvallisuustoimenpiteille organisaatioille, jotka käsittelevät thaimaalaisten asukkaiden henkilötietoja. Asiakastukilokit, jotka sisältävät thaimaalaisia nimiä, osoitteita ja yhteystietoja, kuuluvat PDPA:n piiriin.
Indonesian PDPLaki: Indonesian kattava Henkilötietojen suojaamis laki luo velvoitteita organisaatioille, jotka käsittelevät indonesialaisten asukkaiden henkilötietoja, mukaan lukien vaatimukset asianmukaisista turvallisuustoimenpiteistä.
Vietnam PDPD (Henkilötietojen suojausmääräys): Vietnamin vuoden 2023 henkilötietojen suojauskehys kattaa vietnamilaisasukkaitten henkilötietojen käsittelyn organisaatioilta, jotka toimivat Vietnamissa tai kohdistavat toimintaansa Vietnamiin.
BPO-yrityksille ja globaaleille organisaatioille, jotka palvelevat APAC-asiakkaita, nämä säädökset luovat saman perustavanlaatuisen vaatimuksen: asiakastiedoissa oleva PII on tunnistettava ja suojattava asianmukaisesti. Tämä vaatimus koskee riippumatta siitä, mitä kieltä asiakas käytti.
500 000 Keskustelun Volyymiongelma
Singaporessa sijaitseva fintech, joka käsittelee 500 000 asiakastukikeskustelua kuukausittain 12 APAC-kielellä, kohtaa erityisen operatiivisen haasteen: heidän vaatimustenmukaisuusvelvoitteensa kattaa kaikki 500 000 vuorovaikutusta, mutta heidän PII-tunnistustyökalunsa kattaa tarkasti vain englanninkielisen osajoukon.
Jos 30 % vuorovaikutuksista on englanniksi ja työkalu saavuttaa 90 % tunnistustarkkuuden englanninkieliselle PII:lle, työkalu suojaa onnistuneesti 135 000 vuorovaikutusta. Jäljelle jäävät 365 000 ei-englanninkielistä vuorovaikutusta — jotka edustavat thaimaalaista, indonesialaista, vietnamilaisista, filippiiniläistä, malaijia, koreaa, japania ja muita kieliä — kulkevat läpi minimaalisen PII-tunnistuksen kanssa.
Vaatimustenmukaisuuden tila: 73 % kuukausittaisista vuorovaikutuksista ei ole riittävästi suojattu, vaikka vaatimustenmukaisuusvelvoite kattaa kaikki 500 000.
365 000 ei-englanninkielisen vuorovaikutuksen manuaalinen tarkastaminen kohtuullisella ihmisten tarkastusnopeudella ei ole operatiivisesti mahdollista. Organisaation on saatava automatisoitu PII-tunnistus, joka kattaa heidän todellisen kielisekoituksensa, ei vain englantia.
Mitä Ristiinlingvistinen Arkkitehtuuri Tarjoaa
XLM-RoBERTa — ristiinlingvistinen transformer-malli, joka on koulutettu yli 100 kielen tekstillä — tarjoaa entiteettitunnistusta, joka yleistää kielirajojen yli. Malli, joka on koulutettu monikielisillä korpuksilla, oppii, että nimet, paikat ja organisaatiot jakavat rakenteellisia malleja eri kielillä, vaikka pinnalliset muodot eroavat täysin.
APAC-kielille:
- Indonesia (ID): XLM-RoBERTa tarjoaa entiteettitunnistusta henkilönnimille, organisaatioille ja paikoille Bahasa Indonesiaksi
- Thaimaa (TH): Ristiinlingvistinen siirto sukulaiskieliperheistä tarjoaa perustason PII-tunnistusta
- Vietnami (VI): Entiteettitunnistus, jossa on tonaalisen kielen tietoisuus
- Filippiinit (TL): Peitto Tagalog-kielisille asiakaskeskusteluille
Yhdistettynä kielikohtaisiin Stanza-malleihin kielille, joille on saatavilla omistettuja malleja, ristiinlingvistinen lähestymistapa laajentaa automatisoitua PII-tunnistusta koko APAC-kielisekoitukseen — ei vain englanninkieliseen osajoukkoon.
BPO:ille vaatimustenmukaisuusvaikutus on mitattavissa: sen sijaan, että suojattaisiin 27 % kuukausittaisista vuorovaikutuksista, kattava monikielinen tunnistus kattaa koko volyymin. Manuaalisen tarkastuksen taakka laskee 365 000 vuorovaikutuksesta laatuvalvontanäytteeseen.
Lähteet: