Kieliaukko BPO:ssa
APAC-tukitiimit käsittelevät keskusteluja monilla kirjoitusjärjestelmillä. Thainkieliset asiakkaat kirjoittavat thainkielellä. Indonesiankieliset asiakkaat kirjoittavat bahasalla. Vietnaminkieliset asiakkaat kirjoittavat vietnaminkielellä.
Nämä keskustelutietueet sisältävät henkilötietoja. Nimiä. Puhelinnumeroita. Osoitteita. Tunnisteiden numeroita. Kaikki paikallisessa kirjoitusjärjestelmässä.
Yksikielinen työkalu epäonnistuu tässä. Niiden mallit on koulutettu länsimaisella tekstillä. Nimitunnistimet ovat oppineet latinalaiskirjaimisia nimimuotoja. Osoitemallit ovat oppineet länsimaisia osoiterakenteita.
Thailainen kirjoitusjärjestelmä on näkymätön yksikieliselle mallille. Indonesian osoite ei vastaa latinalaiskirjaimisia kaavoja. Vietnamilainen tonaalinen teksti lisää ylimääräisen epäsopivuuskerroksen. Tulos: lähes nolla henkilötietojen kiinnijäämistä muille kuin latinalaisille tietueille.
Useimmat APAC-keskustelut eivät ole englanninkielisiä. Tämä ei ole reunatilanne. Suurille BPO-yrityksille se on normi.
Sääntelyvelvoitteet APAC:ssa
Kolme tietosuojalakia kattaa nyt nämä alueet. Jokainen on voimassa. Jokainen koskee BPO-yrityksiä, jotka käsittelevät APAC-asiakastietoja.
Thaimaan PDPA: Voimassa vuodesta 2022. Edellyttää tietojen minimointia, suostumusta ja turvatoimia. Tukitietueet, joissa on thaimaalaiset nimet, kuuluvat sen soveltamisalaan.
Indonesian PDPLaw: Kattaa kaikki yritykset, jotka käsittelevät asukkaiden tietoja. Edellyttää turvatoimia henkilötietueille.
Vietnamilainen PDPD: Vietnamin vuoden 2023 asetus koskee mitä tahansa yritystä, joka käsittelee vietnamilaisten asukkaiden tietoja. Yrityksen sijainnilla ei ole väliä.
Kaikilla kolmella on yksi perussääntö: etsi henkilötiedot ja suojaa ne. Tämä sääntö pätee jokaisella kirjoitusjärjestelmällä, jota asiakkaat käyttävät. Katso vaatimustenmukaisuusyleiskatsauksemme siitä, miten nämä lait vaikuttavat BPO-työhön.
500 000 keskustelun ongelma
Singaporelainen fintech-yritys käsittelee 500 000 tukikeskustelua kuukausittain. Se palvelee asiakkaita 12 APAC-murroksessa. Sen oikeudellinen velvollisuus kattaa kaikki 500 000.
Sen vain englanninkielinen työkalu kattaa vain englanninkielisen osuuden.
Oletetaan, että 30 % keskusteluista on englanninkielisiä. Oletetaan, että tarkkuus on 90 %. Tämä suojaa noin 135 000 keskustelua. Loput 365 000 kulkee läpi lähes ilman henkilötietolöydöksiä.
Tämä jättää 73 % keskusteluista suojaamatta. 365 000 keskustelun manuaalinen tarkistus ei ole toteutettavissa. Pelkät henkilöstökustannukset tekevät siitä epäkäytännöllisen. Automaattisten työkalujen on katettava todellinen käytettyjen kirjoitusjärjestelmien sekoitus — ei vain yksi.
Monikielinen tunnistus
XLM-RoBERTa on yli 100 kielessä koulutettu malli. Se oppii, että nimet, paikat ja yritykset jakavat kaavoja eri kirjoitusjärjestelmien välillä. Se toimii, vaikka pintainen teksti näyttäisi täysin erilaiselta.
APAC-kattavuus sisältää neljä keskeistä kirjoitusjärjestelmää:
Bahasa Indonesia — löytää nimet, yritykset ja paikat. Thaimaa — perus henkilötiedot kieltenvälisen siirron avulla. Vietnami — entiteettien tunnistus tonaalisen kirjoituksen tuella. Filippiini — kattavuus tagalogitekstisten keskustelujen käsittelyyn.
Stanza lisää mallit kirjoitusjärjestelmille, joissa niitä on saatavilla. Molemmat työkalut yhdessä kattavat koko APAC-sekoituksen. Kumpikaan ei vaadi erillistä työkalua jokaiselle kirjoitusjärjestelmälle. Katso tietoturvaoppaastamme asennusvaiheet.
Vaatimustenmukainen vaikutus on selvä. Sen sijaan, että katettaisiin 27 % keskusteluista, täysi monikielinen tunnistus kattaa kaikki. Manuaalisen tarkastuksen jono pienenee sadoista tuhansista pieneksi otostarkastukseksi.
Miksi tämä on tärkeää nyt
Thaimaan PDPA, Indonesian PDPLaw ja Vietnamin PDPD ovat kaikki voimassa. Sääntelyviranomaiset odottavat yritysten löytävän henkilötiedot jokaisella kirjoitusjärjestelmällä, jota heidän asiakkaansa käyttävät.
Yksikielinen työkalu ei täytä tätä tavoitetta. Monikieliset mallit täyttävät. BPO-yrityksille, joilla on laaja APAC-käyttäjäpohja, tällä aukolla on merkitystä. Se on raja oikeudellisen riskin ja oikeudellisen suojan välillä.