Späť na blogGDPR a Dodržiavanie

Token Mapping v AI Workflow: GDPR Bezpečné zákaznícke...

AI workflow v zákazníckom servise (ChatGPT, Claude) potrebujú token mapping — nahradenie PII tokenmi pred poslaním do AI.

April 20, 20268 min čítania
token mapping AIGDPR customer service AIauto-decryptsession-based anonymizationAI workflow pseudonymization

Problém: PII v AI Workflows

Zákaznícky agent v ChatGPT:

  • Zákazník: „Môj e-mail je john@example.com a som nespokojný s objednávkou"
  • Agent kopíruje do ChatGPT: „Zákazník hovorí, že je nespokojný s objednávkou #12345, e-mail john@example.com"
  • ChatGPT vracia: „Odpoveď by bola..."
  • Agent upravuje a posiela zákazníkovi

PROBLÉM: E-mail a číslo objednávky boli odoslané OpenAI bez DPA — porušenie GDPR.

Riešenie: Token Mapping

Token mapping znamená:

  1. Pred ChatGPT: PII sa nahradí tokenmi
  2. ChatGPT: Vracia odpoveď s tokenmi, bez PII
  3. Po ChatGPT: Tokeny sa nahradí zpátky na pôvodné PII

Výsledok: ChatGPT nikdy neuvidí PII — len tokeny.

Ako to technicky funguje

Verzia 1: Predak spracovanie (Najjednoduchšia)

1. Agent zadá: „Zákazník john@example.com je nespokojný s objednávkou #12345"
2. Systém detekuje PII:
   - john@example.com = EMAIL
   - #12345 = ORDER_ID
3. Systém nahradí: „Zákazník [EMAIL_1] je nespokojný s objednávkou [ORDER_1]"
4. Posiela ChatGPT: „Zákazník [EMAIL_1] je nespokojný s objednávkou [ORDER_1]"
5. ChatGPT vracia: „Môžete vyhľadať [ORDER_1] v systéme a ponúknuť vrátenie"
6. Systém nahradí tokeny:
   - [EMAIL_1] → john@example.com
   - [ORDER_1] → #12345
7. Agent vidí: „Môžete vyhľadať #12345 v systéme a ponúknuť vrátenie"

Verzia 2: AI-based detekcia (Presnosť)

  • Používajte NLP model (ako spaCy, BERT) na detekciu PII
  • Algoritmy:
    • E-mail: Regex [a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}
    • Telefón: Regex \+?1?\d{9,15}
    • SSN: Regex \d{3}-\d{2}-\d{4}
  • Vygenerovať tokeny pre každý detekovaný PII
  • Mapovať: PII → token v databáze

GDPR Implications

V GDPR:

  • Bez DPA potreby: Ak ChatGPT nikdy nevidí PII, nie je to spracovanie osobných údajov
  • Bez notifikácie porušenia: Ak ChatGPT nevidí PII, nie je porušenie (ak sa ChatGPT vylámi, PII sa nenachádza)
  • Bez práv subjektov: Ak ChatGPT nevidí PII, subjekt údajov nemá právo na prístup k údajom v ChatGPT

Príklad:

  • Bez token mapping: ChatGPT vidí e-mail → GDPR článok 6 platí → DPA potreba → Registrácia v DPA
  • S token mapping: ChatGPT vidí [EMAIL_1] → Nie PII → GDPR neplatí → Bez DPA

Príklady

Príklad 1: Zákaznícke e-maily

  • Agent prijme e-mail: „Ahoj, môj číslo objednávky je #ABC123. Chcem zrušiť."
  • Token mapping:
    • #ABC123 → [ORDER_1]
  • ChatGPT dostane: „Zákazník chce zrušiť objednávku [ORDER_1]"
  • ChatGPT vracia: „Potvrdím zrušenie [ORDER_1]"
  • Agent vidí: „Potvrdím zrušenie #ABC123"

Príklad 2: Technická podpora s citlivými údajmi

  • Agent: „Zákazník sa prihlasuje ako admin@company.com s hesláom"
  • Token mapping:
  • ChatGPT dostane: „Zákazník sa prihlasuje ako [EMAIL_2]"
  • ChatGPT vracia: „Obnovte heslo — nepošlite heslo agentovi"
  • Agent vidí: „Obnovte heslo — nepošlite heslo agentovi"

Príklad 3: Účet zákazníka v systéme

  • Agent vyhľadá zákazníka: jmeno="John Smith", email="john@example.com"
  • Záznam v systéme: User ID = 12345
  • Agent posiela do ChatGPT: „Zákazník s User ID [USER_1] sa sťažuje na faktúru"
  • ChatGPT vracia: „Vyhľadajte faktúru [USER_1] a pošlite päť súvisiacich"
  • Agent vidí: „Vyhľadajte faktúru 12345 a pošlite päť súvisiacich"

Implementácia

Tri úrovne:

Úroveň 1: Regex token mapping

  • Identifikujte PII pomocou regex
  • Nahraďte tokenmi
  • Odloženie pre spätne mapovanie
  • Výhody: Jednoduchá, rýchla
  • Nevýhody: Menej presná (Regex nemusí zachytiť všetky)

Úroveň 2: NLP-based detekcia

  • Používajte NLP model (spaCy, BERT) na detekciu PII
  • Algoritmy overia typ PII
  • Nahraďte tokenmi
  • Výhody: Presnejšie, detekuje komplexné PII
  • Nevýhody: Pomalšie, vzdelávanie potrebné

Úroveň 3: Cloud-based detekcia

  • Pošlite text do Cloud PII detektoru (Google Cloud DLP, Microsoft Presidio)
  • Detektor vracia detekované PII s skóre spoľahlivosti
  • Vy nahraďte tokenmi
  • Výhody: Najpresnejšia, stále upravuje sa
  • Nevýhody: Potrebný internet, Bezpečnosť tretej strany

Budúcnosť

Token mapping sa stáva štandardom v AI workflow zákazníckeho servisa:

  • Slack integruje token mapping pre AI asistentov
  • GitHub Copilot ponúka token mapping pre GitHub API
  • OpenAI ponúka API s token mapping pre Business subscribers

Klávesnica správu: Token mapping eliminuje potrebu DPA pre ChatGPT v zákazníckom servise.

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.