anonym.legal
Назад до блогуGDPR та відповідність

Токенне відображення для ИИ-робочих процесів...

Коли імена клієнтів анонімізуються перед обробкою ИИ, відповідь ИИ містить анонімізовані токени.

April 19, 20268 хв читання
token mapping AIGDPR customer service AIauto-decryptsession-based anonymizationAI workflow pseudonymization

Проблема токенного відображення

Організації, що використовують ИИ для клієнтоорієнтованих робочих процесів, стикаються з конкретною технічною проблемою анонімізації: повний цикл роботи вимагає, щоб анонімізовані вхідні дані давали відповіді, які можна деанонімізувати для агента.

Робочий процес без токенного відображення: скарга клієнта, що містить «Марія Шмідт», анонімізується до «[CUSTOMER_1]» перед обробкою ИИ. Claude обробляє анонімізовану скаргу та складає відповідь: «Шановний(а) [CUSTOMER_1], просимо вибачення за затримку з вашим замовленням.» Обробник претензій повинен вручну замінити «[CUSTOMER_1]» на «Марія Шмідт» перед відправленням. При 200 клієнтських зверненнях на день ручна заміна токенів займає значний час агента — достатньо, щоб нівелювати продуктивні переваги ИИ-підтримки.

Робочий процес з постійним токенним відображенням: та ж анонімізація створює таблицю відображення, що зберігається у поточній сесії. «[CUSTOMER_1]» → «Марія Шмідт». Коли чернетка відповіді Claude відображається агенту, система автоматично відновлює відображені токени. Агент бачить: «Шановна Маріє Шмідт, просимо вибачення за затримку з вашим замовленням.» Без ручних замін.

Архітектура стійкого до сесій відображення

Технічна реалізація токенного відображення вимагає чотирьох компонентів:

1. Генерація токенів при вхідних даних Анонімізатор призначає детерміновані токени при першому зустрічанні кожного унікального значення. «Марія Шмідт» → «[CUSTOMER_1]» при першому зустрічанні. Повторне зустрічання «Марії Шмідт» у тому ж документі отримує той самий токен «[CUSTOMER_1]». Послідовність підтримується у документі.

2. Зберігання таблиці відображення Таблиця відображення {«[CUSTOMER_1]»: «Марія Шмідт»} зберігається стійко у межах сесії. Для HTTP-сесій — у стані сервера або зашифрованому кукі. Для пакетних сесій — у файлі відображення, що зберігається поруч із анонімізованим виходом.

3. Деанонімізація виходу Відповідь ИИ повертається через той самий движок деанонімізації, який зберігає стійкий криптографічно пов'язаний ключ шифрування. Токени у відповіді замінюються на оригінальні значення. Відображення є детермінованим — той самий токен завжди відновлюється до того самого значення у межах сесії.

4. Ізоляція сесій Таблиці відображення ізольовані за сесією. Токени від Сесії А не переходять до Сесії Б. Агенти, що обробляють різних клієнтів одночасно, отримують ізольовані контексти — «[CUSTOMER_1]» у Сесії А відноситься до іншого клієнта, ніж «[CUSTOMER_1]» у Сесії Б.

Зразок виводу служби підтримки

Реальний приклад клієнтського листа електронної пошти перед анонімізацією:

«Привіт, мене звуть Томас Вебер, номер клієнта CUS-441892. Я придбав ноутбук 15 березня, замовлення №ORD-229341. Він не вмикається. Мій номер телефону 030-44192837.»

Після анонімізації з токенним відображенням, надісланого до Claude:

«Привіт, мене звуть [CUSTOMER_1], номер клієнта [ID_1]. Я придбав ноутбук 15 березня, замовлення №[ORDER_1]. Він не вмикається. Мій номер телефону [PHONE_1].»

Відповідь Claude:

«Шановний(а) [CUSTOMER_1], дякуємо за звернення. Ваше замовлення [ORDER_1] підтверджено та передано до технічної підтримки. Наш технік зв'яжеться з вами за номером [PHONE_1] протягом 24 годин.»

Після деанонімізації, показаної агенту:

«Шановний Томасе Вебере, дякуємо за звернення. Ваше замовлення №ORD-229341 підтверджено та передано до технічної підтримки. Наш технік зв'яжеться з вами за номером 030-44192837 протягом 24 годин.»

Жодних ручних замін. Жодного розкриття PII до ИИ. Повна відповідь, готова до відправлення.

GDPR-відповідність токенного відображення

Токенне відображення відповідає принципам обробки GDPR трьома способами:

Мінімізація даних (Стаття 5(1)(c)): ИИ-модель ніколи не отримує справжніх імен клієнтів, номерів телефонів або ідентифікаторів. Обробляється лише мінімальний набір даних (токенізований вміст), необхідний для виконання завдання.

Цілісність та конфіденційність (Стаття 5(1)(f)): Таблиця відображення зберігається зашифрованою. Ключ шифрування унікальний для сесії. Навіть якщо ИИ-провайдер захопить вихід ИИ, він не може зіставити «[CUSTOMER_1]» з реальними клієнтськими даними без ключа шифрування сесії.

Обмеження мети (Стаття 5(1)(b)): Токени є функціональними замінниками у контексті сесії обробки. Вони не використовуються для профілювання, агрегації або будь-якого іншого призначення поза цільовим конкретним робочим процесом ИИ.

Типи ідентифікаторів для відображення в клієнтських зверненнях

Реалізація токенного відображення для клієнтського сервісу охоплює кілька категорій ідентифікаторів:

  • Ідентифікатори особи: Ім'я, прізвище, юридична назва компанії
  • Ідентифікатори облікового запису: Номери клієнтів, номери замовлень, номери договорів
  • Контактні дані: Телефон, електронна пошта, поштова адреса
  • Платіжні ідентифікатори: Номери транзакцій, останні 4 цифри карток, ідентифікатори квитанцій
  • Географічні ідентифікатори: Конкретні адреси (місто та країна можуть залишатись видимими залежно від потреб сервісу)

Відображення підтримує послідовність між типами: якщо «Томас Вебер» → «[CUSTOMER_1]», а «CUS-441892» → «[ID_1]», то ці два токени є послідовно пов'язаними у таблиці відображення. Деанонімізований вивід містить «Томас Вебер» та «CUS-441892» — не лише одне або інше.

Вимірювана операційна цінність

Розгортання токенного відображення для центру обслуговування клієнтів з 200 зверненнями на день, де 30% потребують персоналізованої відповіді:

  • 60 звернень на день з токенами у відповідях ИИ
  • Середній час ручної заміни: 45 секунд на звернення
  • Загальний час ручної заміни: 45 хвилин на день
  • Ануалізовано: ~183 години агентського часу щорічно

При середній вартості агента €35/годину (комплексна компенсація), це €6,405 щорічних прихованих витрат, прямо пов'язаних з відсутністю автоматичного токенного відображення — не рахуючи ризику людської помилки при заміні, яка призводить до надсилання відповіді з неправильним ім'ям клієнта.

Налаштування токенного відображення

anonym.legal реалізує стійке до сесій токенне відображення через API:

POST /api/anonymize
{
  "text": "...",
  "session_id": "session-uuid",
  "store_mapping": true
}

Response:
{
  "anonymized": "...",
  "mapping_id": "map-uuid"
}

POST /api/deanonymize
{
  "text": "...",
  "mapping_id": "map-uuid"
}

Таблиця відображення зберігається зашифрованою та прив'язаною до mapping_id. Деанонімізація потребує того самого mapping_id, що використовувався при початковій анонімізації. Ключі відображення закінчуються через 24 години, якщо явно не продовжені.

Висновок

Токенне відображення не є необов'язковою функцією для ИИ-клієнтського сервісу — воно є обов'язковою умовою. Без нього ИИ-підтримка залишає ручний крок деанонімізації, який повністю нівелює ефективність ИИ. Із токенним відображенням повний цикл завершується автоматично: PII захищена від ИИ при введенні, ИИ виконує обробку мовою, деанонімізований вивід готовий для доставки клієнту.

Джерела:

  • EDPB Guidelines 01/2025 on Pseudonymisation (edpb.europa.eu)
  • GDPR Article 5(1)(b)(c)(f) — Data protection principles (gdpr.eu)
  • DLA Piper GDPR Fines Report 2025 (dlapiper.com)

Готові захистити свої дані?

Почніть анонімізувати PII з 285+ типами сутностей на 48 мовах.