Problém: PII v AI Workflows
Zákaznícky agent v ChatGPT:
- Zákazník: „Môj e-mail je john@example.com a som nespokojný s objednávkou"
- Agent kopíruje do ChatGPT: „Zákazník hovorí, že je nespokojný s objednávkou #12345, e-mail john@example.com"
- ChatGPT vracia: „Odpoveď by bola..."
- Agent upravuje a posiela zákazníkovi
PROBLÉM: E-mail a číslo objednávky boli odoslané OpenAI bez DPA — porušenie GDPR.
Riešenie: Token Mapping
Token mapping znamená:
- Pred ChatGPT: PII sa nahradí tokenmi
- john@example.com → [EMAIL_1]
- #12345 → [ORDER_1]
- ChatGPT: Vracia odpoveď s tokenmi, bez PII
- Po ChatGPT: Tokeny sa nahradí zpátky na pôvodné PII
- [EMAIL_1] → john@example.com
- [ORDER_1] → #12345
Výsledok: ChatGPT nikdy neuvidí PII — len tokeny.
Ako to technicky funguje
Verzia 1: Predak spracovanie (Najjednoduchšia)
1. Agent zadá: „Zákazník john@example.com je nespokojný s objednávkou #12345"
2. Systém detekuje PII:
- john@example.com = EMAIL
- #12345 = ORDER_ID
3. Systém nahradí: „Zákazník [EMAIL_1] je nespokojný s objednávkou [ORDER_1]"
4. Posiela ChatGPT: „Zákazník [EMAIL_1] je nespokojný s objednávkou [ORDER_1]"
5. ChatGPT vracia: „Môžete vyhľadať [ORDER_1] v systéme a ponúknuť vrátenie"
6. Systém nahradí tokeny:
- [EMAIL_1] → john@example.com
- [ORDER_1] → #12345
7. Agent vidí: „Môžete vyhľadať #12345 v systéme a ponúknuť vrátenie"
Verzia 2: AI-based detekcia (Presnosť)
- Používajte NLP model (ako spaCy, BERT) na detekciu PII
- Algoritmy:
- E-mail: Regex
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,} - Telefón: Regex
\+?1?\d{9,15} - SSN: Regex
\d{3}-\d{2}-\d{4}
- E-mail: Regex
- Vygenerovať tokeny pre každý detekovaný PII
- Mapovať: PII → token v databáze
GDPR Implications
V GDPR:
- Bez DPA potreby: Ak ChatGPT nikdy nevidí PII, nie je to spracovanie osobných údajov
- Bez notifikácie porušenia: Ak ChatGPT nevidí PII, nie je porušenie (ak sa ChatGPT vylámi, PII sa nenachádza)
- Bez práv subjektov: Ak ChatGPT nevidí PII, subjekt údajov nemá právo na prístup k údajom v ChatGPT
Príklad:
- Bez token mapping: ChatGPT vidí e-mail → GDPR článok 6 platí → DPA potreba → Registrácia v DPA
- S token mapping: ChatGPT vidí [EMAIL_1] → Nie PII → GDPR neplatí → Bez DPA
Príklady
Príklad 1: Zákaznícke e-maily
- Agent prijme e-mail: „Ahoj, môj číslo objednávky je #ABC123. Chcem zrušiť."
- Token mapping:
- #ABC123 → [ORDER_1]
- ChatGPT dostane: „Zákazník chce zrušiť objednávku [ORDER_1]"
- ChatGPT vracia: „Potvrdím zrušenie [ORDER_1]"
- Agent vidí: „Potvrdím zrušenie #ABC123"
Príklad 2: Technická podpora s citlivými údajmi
- Agent: „Zákazník sa prihlasuje ako admin@company.com s hesláom"
- Token mapping:
- admin@company.com → [EMAIL_2]
- (HESLO sa úplne odstraní — nie token)
- ChatGPT dostane: „Zákazník sa prihlasuje ako [EMAIL_2]"
- ChatGPT vracia: „Obnovte heslo — nepošlite heslo agentovi"
- Agent vidí: „Obnovte heslo — nepošlite heslo agentovi"
Príklad 3: Účet zákazníka v systéme
- Agent vyhľadá zákazníka: jmeno="John Smith", email="john@example.com"
- Záznam v systéme: User ID = 12345
- Agent posiela do ChatGPT: „Zákazník s User ID [USER_1] sa sťažuje na faktúru"
- ChatGPT vracia: „Vyhľadajte faktúru [USER_1] a pošlite päť súvisiacich"
- Agent vidí: „Vyhľadajte faktúru 12345 a pošlite päť súvisiacich"
Implementácia
Tri úrovne:
Úroveň 1: Regex token mapping
- Identifikujte PII pomocou regex
- Nahraďte tokenmi
- Odloženie pre spätne mapovanie
- Výhody: Jednoduchá, rýchla
- Nevýhody: Menej presná (Regex nemusí zachytiť všetky)
Úroveň 2: NLP-based detekcia
- Používajte NLP model (spaCy, BERT) na detekciu PII
- Algoritmy overia typ PII
- Nahraďte tokenmi
- Výhody: Presnejšie, detekuje komplexné PII
- Nevýhody: Pomalšie, vzdelávanie potrebné
Úroveň 3: Cloud-based detekcia
- Pošlite text do Cloud PII detektoru (Google Cloud DLP, Microsoft Presidio)
- Detektor vracia detekované PII s skóre spoľahlivosti
- Vy nahraďte tokenmi
- Výhody: Najpresnejšia, stále upravuje sa
- Nevýhody: Potrebný internet, Bezpečnosť tretej strany
Budúcnosť
Token mapping sa stáva štandardom v AI workflow zákazníckeho servisa:
- Slack integruje token mapping pre AI asistentov
- GitHub Copilot ponúka token mapping pre GitHub API
- OpenAI ponúka API s token mapping pre Business subscribers
Klávesnica správu: Token mapping eliminuje potrebu DPA pre ChatGPT v zákazníckom servise.