Voltar ao BlogTécnico

Privacidade de Dados na APAC: Por que Sua Ferramenta...

Uma fintech de Cingapura que processa 500.000 chats de suporte mensalmente em 12 idiomas da APAC descobriu que sua ferramenta apenas em inglês...

March 24, 20267 min de leitura
APAC PII detectionThai PIIIndonesian data privacyVietnamese NERPDPA compliance

O Problema da Linguagem no BPO

As empresas de Business Process Outsourcing operam na realidade multilíngue do suporte ao cliente da APAC. Quando um cliente na Tailândia contata o suporte em tailandês, quando um cliente indonésio escreve em Bahasa Indonésia, quando um cliente vietnamita usa o vietnamita — o registro do chat é criado naquele idioma. E quando esses registros de chat são analisados para garantia de qualidade, treinamento ou auditoria de conformidade, as PII que eles contêm estão naquele idioma.

As ferramentas de detecção de PII centradas no inglês não foram construídas para esse ambiente. Seus reconhecedores de entidades foram treinados em texto em inglês. Seus modelos de detecção de nomes aprenderam padrões de nomes em inglês. Sua detecção de endereços foi treinada em formatos de endereços em inglês.

Aplicadas a registros de chat em tailandês, indonésio ou vietnamita, essas ferramentas produzem taxas de detecção quase zero para PII específicas de cada idioma. O nome de um cliente tailandês, escrito em alfabeto tailandês, é invisível para um modelo que aprendeu nomes a partir de texto em inglês. Um endereço indonésio, seguindo as convenções de endereço indonésias, não corresponde aos padrões que um reconhecedor de endereços treinado em inglês espera.

As Consequências da Conformidade na APAC

As regulamentações de proteção de dados em toda a APAC criam obrigações de conformidade para organizações que processam PII de clientes:

PDPA da Tailândia (Lei de Proteção de Dados Pessoais): Em vigor desde 2022, a PDPA da Tailândia impõe requisitos de minimização de dados, consentimento e medidas de segurança sobre organizações que processam dados pessoais de residentes tailandeses. Registros de suporte ao cliente que contêm nomes, endereços e informações de contato tailandeses estão sob a abrangência da PDPA.

Lei de Proteção de Dados Pessoais da Indonésia: A abrangente Lei de Proteção de Dados Pessoais da Indonésia cria obrigações para organizações que processam dados pessoais de residentes indonésios, incluindo requisitos para medidas de segurança apropriadas.

PDPD do Vietnã (Decreto de Proteção de Dados Pessoais): O quadro de proteção de dados pessoais de 2023 do Vietnã cobre o processamento de dados pessoais de residentes vietnamitas por organizações que operam ou visam o Vietnã.

Para empresas de BPO e organizações globais que atendem clientes da APAC, essas regulamentações criam a mesma exigência fundamental: PII nos dados dos clientes deve ser identificada e adequadamente protegida. A exigência se aplica independentemente do idioma que o cliente usou.

O Problema do Volume de 500.000 Chats

Uma fintech baseada em Cingapura que processa 500.000 registros de chat de suporte ao cliente mensalmente em 12 idiomas da APAC enfrenta um desafio operacional específico: sua obrigação de conformidade cobre todas as 500.000 interações, mas sua ferramenta de detecção de PII cobre com precisão apenas o subconjunto em inglês.

Se 30% das interações são em inglês e a ferramenta alcança 90% de precisão na detecção de PII em inglês, a ferramenta protege com sucesso 135.000 interações. As 365.000 interações restantes não em inglês — representando dados de clientes tailandeses, indonésios, vietnamitas, filipinos, malaio, coreano, japonês e outros idiomas — passam com detecção mínima de PII.

A postura de conformidade: 73% das interações mensais não estão adequadamente protegidas, mesmo que a obrigação de conformidade cubra todas as 500.000.

A revisão manual de 365.000 interações não em inglês a qualquer taxa razoável de revisão humana não é operacionalmente viável. A organização precisa de detecção automatizada de PII que cubra sua mistura real de idiomas, não apenas o inglês.

O que a Arquitetura Cross-Lingual Oferece

XLM-RoBERTa — um modelo de transformador cross-lingual treinado em texto de mais de 100 idiomas — fornece reconhecimento de entidades que generaliza através das fronteiras linguísticas. Um modelo treinado em corpora multilíngues aprende que nomes, locais e organizações compartilham padrões estruturais entre os idiomas, mesmo quando as formas superficiais diferem completamente.

Para idiomas da APAC:

  • Indonésio (ID): XLM-RoBERTa fornece reconhecimento de entidades para nomes de pessoas, organizações e locais em Bahasa Indonésia
  • Tailandês (TH): A transferência cross-lingual de famílias de idiomas relacionadas fornece detecção básica de PII
  • Vietnamita (VI): Reconhecimento de entidades com consciência tonal
  • Filipino (TL): Cobertura para interações de clientes em língua tagalo

Combinado com modelos Stanza específicos de idioma para idiomas onde modelos dedicados estão disponíveis, a abordagem cross-lingual estende a detecção automatizada de PII para toda a mistura de idiomas da APAC — não apenas o subconjunto em inglês.

Para os BPOs, a implicação de conformidade é mensurável: em vez de proteger 27% das interações mensais, a detecção multilíngue abrangente cobre todo o volume. O ônus da revisão manual cai de 365.000 interações para uma amostra de controle de qualidade.

Fontes:

Pronto para proteger seus dados?

Comece a anonimizar PII com mais de 285 tipos de entidades em 48 idiomas.