Vissza a BlograTechnikai

A Közel-Kelet megfelelőségi rése: Miért láthatatlan...

A GDPR nem ér véget a Boszporusznál. Az arab és héber PII az EU üzleti munkafolyamatokban szisztematikusan védtelen.

April 1, 20268 perc olvasás
Arabic PII detectionHebrew NERRTL text processingMENA GDPR complianceXLM-RoBERTa multilingual

A MENA-EU adatáramlás valósága

A közel-keleti és észak-afrikai (MENA) régiót EU-val összekötő vállalatok kezelik:

  • Arab ügyfél-adatok GDPR alá eső EU-s rendszerekben
  • Héber munkavállalói adatok EU-s HR-rendszerekben
  • Perzsa (farsi) érintkezési adatok multinacionális ERP-rendszerekben

A GDPR mindezekre egyformán vonatkozik – de a legtöbb PII-eszköz angolcentrikus és nem támogatja az RTL-szkripteket.

Az RTL szöveg technikai kihívásai

Arab PII specifikus problémák

  • Jobbról balra futó szöveg (az angollal szemben)
  • Összekapcsolt betűk – a tokenizáció eltérő
  • Harakat (rövid magánhangzójelek) – nem mindig jelen, de PII-értéket módosíthat
  • Arab számok vs. Hind-Arab számok (٦٧٨٩ vs. 6789)

Héber PII problémák

  • Gematria számrendszer
  • Héber személyigazolvány (Teudat Zehut): 9 jegyű Luhn-algoritmussal
  • Héber névrendszer: sorrend eltér a Nyugattól

Az anonym.legal MENA-lefedettsége

  • Arab NER spaCy modellek (ar)
  • Héber RTL-kompatibilis tokenizáció
  • MENA nemzeti azonosítók: UAE Emirates ID, SAR ID, Israel Teudat Zehut
  • Keresztnyelvi felismerés MENA-EU vegyes dokumentumokhoz

Következtetés

Az EU-MENA üzleti tevékenységek GDPR megfelelőséget igényelnek az arab, héber és perzsa PII-re. Az angolcentrikus eszközök ezt szisztematikusan kihagyják.

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.