anonym.legal
Назад к блогуGDPR и соблюдение

Картирование токенов для AI-рабочих процессов...

Когда имена клиентов анонимизируются перед обработкой AI, ответ AI содержит анонимизированные токены.

April 19, 20268 мин чтения
token mapping AIGDPR customer service AIauto-decryptsession-based anonymizationAI workflow pseudonymization

Проблема картирования токенов

Организации, использующие AI для взаимодействия с клиентами, сталкиваются с конкретной технической проблемой анонимизации: полный рабочий процесс требует, чтобы анонимизированные входные данные производили ответы, которые могут быть деанонимизированы для человеческого агента.

Рабочий процесс без картирования токенов: жалоба клиента, содержащая "Мария Шмидт", анонимизируется в "[CUSTOMER_1]" перед обработкой AI. Claude обрабатывает анонимизированную жалобу и составляет ответ: "Уважаемый [CUSTOMER_1], мы приносим извинения за задержку с вашим заказом." Обработчик претензий должен вручную заменить "[CUSTOMER_1]" на "Марию Шмидт" перед отправкой. При 200 взаимодействиях с клиентами в день ручная замена токенов занимает значительное время агента — достаточно, чтобы свести на нет преимущества производительности от помощи AI.

Рабочий процесс с постоянным картированием токенов: та же анонимизация производит таблицу сопоставления, хранящуюся в текущей сессии. "[CUSTOMER_1]" → "Мария Шмидт." Когда черновик ответа Claude отображается обработчику претензий, слой авто-дешифрования применяет сопоставление сессии, и агент видит "Уважаемая Мария Шмидт" — реальное имя, уже восстановлено. Агент проверяет и отправляет. Нет ручной замены токенов. Защита GDPR работала тихо и полностью.

Последовательность сессии

Картирование токенов должно быть последовательным в пределах одной сессии. Если имя одного и того же клиента анонимизируется в двух разных частях одного и того же разговора — один раз в первоначальной жалобе и один раз в последующем — оно должно сопоставляться с одним и тем же токеном. "[CUSTOMER_1]" всегда должно относиться к одному и тому же человеку в пределах сессии; рассуждения Claude о разговоре зависят от последовательного отслеживания идентичности.

Без последовательности на уровне сессии ответы Claude могут запутать нескольких клиентов (если "[CUSTOMER_1]" в первом сообщении и "[CUSTOMER_1]" в третьем сообщении относятся к разным людям), производя несогласованные ответы, которые агент не может использовать.

Статья 4(5) GDPR признает псевдонимизацию как технику обработки, которая снижает риск несоответствия. Руководящие принципы EDPB по псевдонимизации 2022 года требуют, чтобы ключ псевдонимизации (в данном случае таблица картирования токенов) хранился отдельно от псевдонимизированных данных. Картирование токенов на уровне сессии удовлетворяет этому требованию: таблица сопоставления поддерживается в сессии браузера, а не передается с анонимизированными данными на серверы Claude.

Случай использования страховых претензий

AI-система обработки претензий немецкой страховой компании обрабатывает электронные письма с жалобами клиентов. Имена клиентов, номера полисов и суммы претензий анонимизируются перед обработкой электронных писем Claude. Claude составляет ответы, используя анонимизированные токены. Слой авто-дешифрования в расширении Chrome восстанавливает оригинальную информацию о клиенте в черновике Claude перед его отображением обработчику претензий. Обработчик проверяет черновик, вносит необходимые корректировки и отправляет окончательный ответ с реальными именами клиентов.

Расчет соответствия GDPR: данные, переданные на серверы Claude в США, содержат "[CUSTOMER_1]", "[POLICY_2024-08847]" и "[AMOUNT_1]" — не личные данные, как это определено GDPR. Фактическое имя клиента и номер полиса остаются в Германии на браузере обработчика претензий. Вопрос о передаче данных в соответствии со статьей 46 GDPR — какие меры предосторожности применяются к передаче личных данных в США? — не возникает, поскольку личные данные не были переданы.

Источники:

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.