Ang BPO Language Gap

Hinahawakan ng mga support team ng APAC ang mga chat sa maraming script. Sumusulat ang mga gumagamit ng Thai sa Thai. Sumusulat ang mga gumagamit ng Indonesian sa Bahasa. Sumusulat ang mga gumagamit ng Vietnamese sa Vietnamese.

Naglalaman ng PII ang mga chat log na iyon. Mga pangalan. Mga numero ng telepono. Mga address. Mga numero ng ID. Lahat sa lokal na script.

Nabibigo dito ang mga single-language na tool. Sinanay ang kanilang mga modelo sa Western na teksto. Natutunan ng mga finder ng pangalan ang mga form ng pangalan na may Latin script. Natutunan ng mga modelo ng address ang mga layout ng Western address.

Ang Thai script ay hindi nakikita ng isang monolingual na modelo. Ang isang Indonesian address ay hindi tumutugma sa mga Latin-script na pattern. Nagdaragdag ang Vietnamese tonal na teksto ng isa pang layer ng hindi pagtutugma. Ang resulta: malapit-zero na mga hit ng PII para sa mga non-Latin na log.

Karamihan sa mga APAC chat ay hindi sa English. Hindi ito isang niche na agwat. Para sa malalaking BPO, ito ay pamantayan.

Mga Stake sa Pagsunod sa APAC

Tatlong batas sa data ang sumasaklaw na sa mga rehiyong ito. Ang bawat isa ay may bisa. Ang bawat isa ay nalalapat sa mga BPO firm na humahawak ng data ng customer ng APAC.

Thailand PDPA: Aktibo mula 2022. Nangangailangan ng data minimization, pahintulot, at mga kontrol sa seguridad. Ang mga support log na may mga pangalang Thai ay nasa ilalim ng saklaw nito.

Indonesia PDPLaw: Sumasaklaw sa lahat ng firm na nagpoproseso ng data ng mga residente. Nangangailangan ng mga hakbain sa seguridad para sa mga personal na rekord.

Vietnam PDPD: Ang decreto ng Vietnam noong 2023 ay nalalapat sa sinumang firm na humahawak ng data ng mga residente ng Vietnam. Ang lokasyon ng firm ay hindi mahalaga.

May iisang pangunahing panuntunan ang lahat ng tatlo: hanapin ang PII at protektahan ito. Ang panuntunang iyon ay nangangaibayo sa bawat script na ginagamit ng customer. Tingnan ang aming compliance overview para sa kung paano nakakaapekto ang mga batas na ito sa trabaho ng BPO.

Ang 500,000-Chat na Problema

Nagpapatakbo ang isang Singapore fintech ng 500,000 support chat bawat buwan. Naglilingkod ito sa mga customer sa 12 APAC na dayalekto. Ang legal na tungkulin nito ay sumasaklaw sa lahat ng 500,000.

Ang English-only na tool nito ay sumasaklaw lamang sa English na bahagi.

Sabihin nating 30% ng mga chat ay sa English. Sabihin nating 90% ang katumpakan doon. Iyon ay nagpoprotekta ng humigit-kumulang 135,000 chat. Ang iba pang 365,000 ay dumadaan nang halos walang nahanap na PII.

Iyon ay nag-iiwan ng 73% ng mga chat na walang proteksyon. Ang manual na review ng 365,000 chat ay hindi magagawa. Ang mga gastos sa staff lamang ay nagpapaging hindi praktikal nito. Ang mga automated na tool ay kailangang sumasaklaw sa tunay na halo ng mga script na ginagamit - hindi lamang isa.

Cross-Lingual Detection

Ang XLM-RoBERTa ay isang modelo na sinanay sa 100-plus na wika. Natututo itong ang mga pangalan, lugar, at firm ay nagbabahagi ng mga pattern sa buong script. Gumagana ito kahit na ang surface na teksto ay mukhang magkaiba.

Ang coverage ng APAC ay kinabibilangan ng apat na pangunahing script:

Bahasa Indonesia - nakakahanap ng mga pangalan, firm, at lokasyon. Thai - baseline PII sa pamamagitan ng cross-lingual transfer. Vietnamese - pag-detect ng entity na may suporta sa tonal-script. Filipino - coverage para sa mga chat na may teksto sa Tagalog.

Nagdaragdag ang Stanza ng mga modelo para sa mga script kung saan sila umiiral. Ang dalawang tool na magkasama ay sumasaklaw sa buong APAC na halo. Wala sa alinman ang nangangailangan ng hiwalay na tool bawat script. Tingnan ang aming gabay sa seguridad para sa mga hakbang sa pag-setup.

Malinaw ang epekto sa pagsunod. Sa halip na sumasaklaw ng 27% ng mga chat, ang buong multilingual na pag-detect ay sumasaklaw sa lahat ng mga ito. Bumababa ang pila ng manual na review mula sa daan-daang libo hanggang sa isang maliit na spot-check.

Bakit Mahalaga Ito Ngayon

Ang Thailand PDPA, Indonesia PDPLaw, at Vietnam PDPD ay lahat ay aktibo. Inaasahan ng mga regulator na mahanap ng mga firm ang PII sa bawat script na ginagamit ng kanilang mga customer.

Hindi natutugunan ng mga monolingual na tool ang bar na iyon. Ginagawa ito ng mga cross-lingual na modelo. Para sa mga BPO na may malawak na base ng gumagamit ng APAC, mahalaga ang agwat. Ito ang linya sa pagitan ng legal na panganib at legal na takip.

Mga Pinagkukunan

Mga Kaugnay na Artikulo

Teknikal

Handa nang protektahan ang iyong data?

Simulan ang anonymization ng PII gamit ang 285+ uri ng entidad sa 48 wika.

Simulan ang Libreng Pagsubok Tingnan ang Mga Tampok

APAC PII: Thai, Indonesian, Vietnamese

Ang BPO Language Gap

Mga Stake sa Pagsunod sa APAC

Ang 500,000-Chat na Problema

Cross-Lingual Detection

Bakit Mahalaga Ito Ngayon

Mga Pinagkukunan

Mga Kaugnay na Artikulo

Presidio: 3-Week Setup vs Managed PII

6 Weeks to 3 Days: Managed PII Setup

Free PII Detection Costs €13K/Year

Handa nang protektahan ang iyong data?

APAC PII: Thai, Indonesian, Vietnamese

Ang BPO Language Gap

Mga Stake sa Pagsunod sa APAC

Ang 500,000-Chat na Problema

Cross-Lingual Detection

Bakit Mahalaga Ito Ngayon

Mga Pinagkukunan

Mga Kaugnay na Artikulo

Presidio: 3-Week Setup vs Managed PII

6 Weeks to 3 Days: Managed PII Setup

Free PII Detection Costs €13K/Year

Handa nang protektahan ang iyong data?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow