Volver al BlogTécnico

Privacidad de Datos en APAC: Por Qué Su Herramienta...

Una fintech de Singapur que procesa 500,000 chats de soporte mensuales en 12 idiomas de APAC encontró que su herramienta solo en inglés no detectó...

March 24, 20267 min de lectura
APAC PII detectionThai PIIIndonesian data privacyVietnamese NERPDPA compliance

El Problema del Idioma en BPO

Las empresas de Externalización de Procesos de Negocio operan en la realidad multilingüe del soporte al cliente en APAC. Cuando un cliente en Tailandia contacta al soporte en tailandés, cuando un cliente indonesio escribe en Bahasa Indonesia, cuando un cliente vietnamita utiliza vietnamita — el registro del chat se crea en ese idioma. Y cuando esos registros de chat se analizan para asegurar la calidad, capacitación o auditoría de cumplimiento, la PII que contienen está en ese idioma.

Las herramientas de detección de PII centradas en el inglés no fueron diseñadas para este entorno. Sus reconocedores de entidades fueron entrenados en texto en inglés. Sus modelos de detección de nombres aprendieron patrones de nombres en inglés. Su detección de direcciones fue entrenada en formatos de dirección en inglés.

Aplicadas a registros de chat en tailandés, indonesio o vietnamita, estas herramientas producen tasas de detección cercanas a cero para PII específicas del idioma. El nombre de un cliente tailandés, escrito en escritura tailandesa, es invisible para un modelo que aprendió nombres de texto en inglés. Una dirección indonesia, siguiendo las convenciones de dirección indonesias, no coincide con los patrones que un reconocedor de direcciones entrenado en inglés espera.

Las Apuestas de Cumplimiento en APAC

Las regulaciones de protección de datos en APAC crean obligaciones de cumplimiento para las organizaciones que procesan PII de clientes:

PDPA de Tailandia (Ley de Protección de Datos Personales): Efectiva desde 2022, la PDPA de Tailandia impone requisitos de minimización de datos, consentimiento y medidas de seguridad a las organizaciones que procesan datos personales de residentes tailandeses. Los registros de soporte al cliente que contienen nombres, direcciones e información de contacto tailandeses caen bajo el alcance de la PDPA.

Ley PDPL de Indonesia: La Ley de Protección de Datos Personales integral de Indonesia crea obligaciones para las organizaciones que procesan datos personales de residentes indonesios, incluyendo requisitos para medidas de seguridad adecuadas.

PDPD de Vietnam (Decreto de Protección de Datos Personales): El marco de protección de datos personales de Vietnam de 2023 cubre el procesamiento de datos personales de residentes vietnamitas por organizaciones que operan en o apuntan a Vietnam.

Para las empresas de BPO y organizaciones globales que sirven a clientes de APAC, estas regulaciones crean el mismo requisito fundamental: la PII en los datos de los clientes debe ser identificada y protegida adecuadamente. El requisito se aplica independientemente del idioma que utilizó el cliente.

El Problema del Volumen de 500,000 Chats

Una fintech con sede en Singapur que procesa 500,000 registros de chat de soporte al cliente mensualmente en 12 idiomas de APAC enfrenta un desafío operativo específico: su obligación de cumplimiento cubre todas las 500,000 interacciones, pero su herramienta de detección de PII cubre con precisión solo el subconjunto en inglés.

Si el 30% de las interacciones son en inglés y la herramienta logra un 90% de precisión en la detección de PII en inglés, la herramienta protege con éxito 135,000 interacciones. Las 365,000 interacciones restantes no en inglés — que representan datos de clientes tailandeses, indonesios, vietnamitas, filipinos, malayos, coreanos, japoneses y de otros idiomas — pasan con una detección mínima de PII.

La postura de cumplimiento: el 73% de las interacciones mensuales no están adecuadamente protegidas, a pesar de que la obligación de cumplimiento cubre las 500,000.

La revisión manual de 365,000 interacciones no en inglés a cualquier tasa razonable de revisión humana no es operativamente factible. La organización necesita detección automatizada de PII que cubra su mezcla de idiomas real, no solo inglés.

Lo Que Proporciona la Arquitectura Multilingüe

XLM-RoBERTa — un modelo de transformador multilingüe entrenado en texto de más de 100 idiomas — proporciona reconocimiento de entidades que se generaliza a través de las fronteras del idioma. Un modelo entrenado en corpora multilingües aprende que nombres, ubicaciones y organizaciones comparten patrones estructurales a través de los idiomas, incluso cuando las formas superficiales difieren completamente.

Para los idiomas de APAC:

  • Indonesio (ID): XLM-RoBERTa proporciona reconocimiento de entidades para nombres de personas, organizaciones y ubicaciones en Bahasa Indonesia
  • Tailandés (TH): La transferencia multilingüe de familias de idiomas relacionadas proporciona detección básica de PII
  • Vietnamita (VI): Reconocimiento de entidades con conciencia del idioma tonal
  • Filipino (TL): Cobertura para interacciones de clientes en idioma tagalo

Combinado con modelos Stanza específicos de idioma para aquellos idiomas donde hay modelos dedicados disponibles, el enfoque multilingüe extiende la detección automatizada de PII a toda la mezcla de idiomas de APAC — no solo al subconjunto en inglés.

Para los BPO, la implicación de cumplimiento es medible: en lugar de proteger el 27% de las interacciones mensuales, la detección multilingüe integral cubre todo el volumen. La carga de revisión manual se reduce de 365,000 interacciones a una muestra de control de calidad.

Fuentes:

¿Listo para proteger sus datos?

Comience a anonimizar PII con más de 285 tipos de entidades en 48 idiomas.