Створення GDPR-сумісного AI для підтримки клієнтів: видалення PII та власних ідентифікаторів перед відправкою до постачальників AI
Ваша команда підтримки клієнтів використовує AI-асистента для складання відповідей, узагальнення історії тикетів та пропозиції рішень. AI чудовий. Продуктивність зросла. Потім ваш DPO переглядає реалізацію.
Повідомлення клієнтів, вставлені в інтерфейс AI, містять:
- Ім'я клієнта: «Привіт, я Сара Джонсон, і моє замовлення...»
- Адресу електронної пошти: «Будь ласка, напишіть мені на sarah.j@gmail.com»
- Ідентифікатор замовлення: «ORD-4521893 ще не прибув»
Ім'я та адреса електронної пошти є персональними даними. Ідентифікатор замовлення також є персональними даними — він пов'язаний із Сарою Джонсон у вашій системі управління замовленнями.
Чому ідентифікатори замовлень є персональними даними
Стандартні інструменти PII виявляють ім'я та адресу електронної пошти. Вони пропускають ідентифікатор замовлення, оскільки він не відповідає шаблону відомого PII — це не SSN, не номер телефону, не адреса.
Але ідентифікатор замовлення є псевдонімним ідентифікатором у розумінні GDPR. Він посилається на фізичну особу через таблицю пошуку у вашій базі даних. Якщо постачальник AI обробляє дані для кількох клієнтів або зберігає дані між сесіями, поєднання ідентифікатора замовлення з загальнодоступними записами або іншими наборами даних клієнта може ідентифікувати суб'єкта даних.
Рішення: конфігурація власних сутностей
Для підтримки клієнтів типової SaaS-компанії:
- Вбудований PII (PERSON, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS): стандартне виявлення
- ORD-XXXXXXX (ідентифікатори замовлень): власна сутність — регулярний вираз ORD-\d{7}
- ACC-XXXXXXXXXX (ідентифікатори облікових записів): власна сутність — регулярний вираз ACC-\d{10}
- Внутрішні ідентифікатори користувачів (USR-XXXXXX): власна сутність
Результат для робочого процесу AI:
- Вхідне повідомлення від клієнта: «ORD-4521893 не прибув, будь ласка, допоможіть sarah.j@gmail.com»
- Після анонімізації: «[ІДЕНТИФІКАТОР_ЗАМОВЛЕННЯ_1] не прибув, будь ласка, допоможіть [EMAIL_1]»
- AI отримує структурований контекст (є проблемне замовлення та адреса електронної пошти) без ідентифікаційних даних
Джерела: