Tillbaka till BloggenGDPR & Efterlevnad

Tokenkartläggning för AI-arbetsflöden...

När kundnamn anonymiseras före AI-behandling innehåller AI:s svar anonymiserade token.

April 19, 20268 min läsning
token mapping AIGDPR customer service AIauto-decryptsession-based anonymizationAI workflow pseudonymization

Tokenkartläggningsproblemet

Organisationer som använder AI för kundinriktade arbetsflöden står inför en specifik teknisk utmaning med anonymisering: hela arbetsflödet kräver att anonymiserade ingångar ger svar som kan de-anonymiseras för den mänskliga agenten.

Arbetsflödet utan tokenkartläggning: kundklagomål som innehåller "Maria Schmidt" anonymiseras till "[CUSTOMER_1]" före AI-behandling. Claude bearbetar det anonymiserade klagomålet och utarbetar ett svar: "Kära [CUSTOMER_1], vi ber om ursäkt för förseningen med din beställning." Handläggaren måste manuellt ersätta "[CUSTOMER_1]" med "Maria Schmidt" innan det skickas. Vid 200 kundinteraktioner per dag tar manuell tokenersättning betydande tid för agenten — tillräckligt för att upphäva produktivitetsfördelen med AI-assistans.

Arbetsflödet med sessionsbeständig tokenkartläggning: samma anonymisering producerar en kartläggningstabell som hålls i den aktuella sessionen. "[CUSTOMER_1]" → "Maria Schmidt." När Claudes utkast till svar visas för handläggaren tillämpas auto-dekrypteringslagret sessionskartläggningen och agenten ser "Kära Maria Schmidt" — det riktiga namnet, redan återställt. Agenten granskar och skickar. Ingen manuell tokenersättning. GDPR-skyddet fungerade tyst och helt.

Sessionskonsistens

Tokenkartläggningen måste vara konsekvent inom en session. Om samma kunds namn anonymiseras i två olika delar av samma konversation — en gång i det initiala klagomålet och en gång i en uppföljning — måste det mappa till samma token. "[CUSTOMER_1]" måste alltid hänvisa till samma person inom en session; Claudes resonemang om konversationen beror på konsekvent identitetsspårning.

Utan sessionsnivåkonsekvens kan Claudes svar förvirra flera kunder (om "[CUSTOMER_1]" i det första meddelandet och "[CUSTOMER_1]" i det tredje meddelandet hänvisar till olika personer), vilket ger inkonsekventa svar som agenten inte kan använda.

GDPR Artikel 4(5) erkänner pseudonymisering som en behandlingsteknik som minskar efterlevnadsrisken. EDPB:s riktlinjer för pseudonymisering 2022 kräver att pseudonymiseringsnyckeln (i detta fall tokenkartläggningstabellen) hålls separat från de pseudonymiserade uppgifterna. Tokenkartläggning på sessionsnivå uppfyller detta krav: kartläggningstabellen underhålls i webbläsarsessionen, inte överförs med de anonymiserade uppgifterna till Claudes servrar.

Användningsfallet för försäkringskrav

Ett tyskt försäkringsbolags AI-drivna system för hantering av krav bearbetar kundklagomåls-e-post. Kundnamn, policynummer och kravbelopp anonymiseras innan Claude bearbetar e-posten. Claude utarbetar svar med hjälp av de anonymiserade token. Auto-dekrypteringslagret i Chrome-tillägget återställer den ursprungliga kundinformationen i Claudes utkast innan det visas för handläggaren. Handläggaren granskar utkastet, gör nödvändiga justeringar och skickar det slutliga svaret med riktiga kundnamn.

GDPR-efterlevnadskalkylen: de uppgifter som överförs till Claudes servrar i USA innehåller "[CUSTOMER_1]", "[POLICY_2024-08847]" och "[AMOUNT_1]" — inte personuppgifter enligt GDPR. Kundens faktiska namn och policynummer förblir i Tyskland på handläggarens webbläsare. Frågan om datatransfer enligt GDPR Artikel 46 — vilka skyddsåtgärder gäller för överföring av personuppgifter till USA? — uppstår inte eftersom personuppgifter inte överfördes.

Källor:

Redo att skydda din data?

Börja anonymisera PII med 285+ entitetstyper på 48 språk.