Tornar al BlogTècnic

Detecció PII Àrab i Hebrea per a Delictes Financers...

[CA] Els sistemes de detecció de PII occidentals no detecten números d'ID àrabs (Emirati, saudita, emiratià) o hebreus.

April 1, 20268 min llegit
Arabic PII detectionHebrew NERRTL text processingMENA GDPR complianceXLM-RoBERTa multilingual

El Problema de la Detecció Multilingüe PII

Els sistemes de detecció de PII occidental detecten:

  • SSN (USA): 9 dígits
  • SIN (Canadà): 9 dígits
  • NIR (França): 15 dígits

Pero no detecten:

  • ID d'Emirati (Emirats): 15 dígits, format específic de xifra de control Luhn
  • Identificador Saudita (Aràbia Saudita): 10-12 dígits
  • ID Israelita (Israel): 9 dígits, algoritme de validació Verhoeff

Els sistemes occidentals 100% fixen en anglès, deixant els números d'ID àrabs i hebreus sense detectar.

Per Què és Crític

MENA (Orient Mitjà, Nord d'Àfrica) és un mercat financer de rràpid creixement. Les empreses que operen a MENA necessiten detectar i anonimitzar números d'ID locals.

Els requisits de GDPR s'estenen als émirats i Israel: els dades personals d'ID han de ser protegides de la mateixa manera que els números occidentals.

Solució

anonym.legal detecta PII multilingüe:

  • Números d'ID àrabs (Emirati, saudita, emiratià, marroquí, tunisià)
  • Números d'ID hebreus
  • Algoritmes de validació específics per llengua
  • Detecció de noms àrabs/hebreus

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.