GDPR 与客服 AI:自定义标识符同样重要
你的客服团队使用 AI 起草回复、审核工单,效率大幅提升。然而当 DPO 审查这套流程时,问题浮出水面。
一条典型的客户消息包含姓名、电子邮件地址和订单编号。姓名和电子邮件是个人数据,订单编号同样如此。它与订单数据库中的 Sarah Johnson 直接关联,AI 供应商可交叉比对,一旦训练数据泄露,该编号便可重新识别当事人。
在没有合法依据的情况下,将上述任何信息发送给外部 AI 供应商,均构成 GDPR 违规。
为何订单编号属于个人数据
GDPR 第 4 条对个人数据的定义极为宽泛,涵盖一切与已识别或可识别自然人相关的信息,包括通过标识符进行的间接识别。
像 ORD-4521893 这样的订单编号是一种间接标识符。单独来看,它并不指向 Sarah Johnson,但与你的订单数据库结合,便能精准定位当事人。
GDPR 第 4 条第 5 款涉及假名化处理。订单编号即为假名,需借助第二个数据源才能还原背后的自然人。当你将其发送给外部 AI 供应商时,即等同于共享了个人数据,需要合法依据和数据处理协议作为前提。
即便供应商未持有你的数据库,你的合规义务也不因此消除。个人数据已被共享,GDPR 依然适用。
标准匿名化的盲区
客服团队通常为 GDPR 合规部署 PII 检测。标准工具可移除常见实体类型。
标准检测能识别客户姓名、电子邮件地址、电话号码和信用卡号,这些均可通过。
标准检测无法识别 ORD-XXXXXXX 格式的订单编号,也会遗漏账户号码、工单编号、内部用户 ID 和订阅 ID,这些均会漏检。
结果看起来是这样的:「您好,我是**[PERSON_1],我的订单 ORD-4521893 还没有收到,请发邮件至[EMAIL_1]**。」
订单编号依然存在。任何有权访问 CRM 的人都能立即找到 Sarah Johnson。匿名化并不完整,这就是合规漏洞所在。
Chrome 扩展:在浏览器层阻断
使用 Claude、ChatGPT 或 Gemini 的客服人员在浏览器中工作。Chrome 扩展能在自定义标识符离开本地之前将其拦截。
工作方式如下:客服人员将客户消息粘贴到 AI 工具,扩展识别到目标为 AI 平台,先移除标准 PII,再应用自定义模式,这些模式匹配你的订单编号格式、账户号码格式以及团队使用的任何其他自定义标识符。客服人员只看到干净的消息内容,原始数据从未到达 AI 端。
合规团队只需配置一次自定义模式,以预设形式共享给所有客服人员。客服无需自行管理,粘贴消息,扩展自动处理,流程不变。
MCP 服务器:在 API 层阻断
部分平台通过 API 调用 AI,例如 Intercom 用 AI 起草回复,Zendesk 用 AI 生成回复建议。MCP 服务器为此类集成在 API 层添加匿名化处理。
流程如下:客户消息进入客服平台,在到达 AI 之前经过 MCP 端点处理,端点移除标准和自定义实体,干净的消息发送给 AI,AI 返回回复内容,整个过程中没有个人数据被共享,客服人员随后在平台中查看并编辑回复。
客服人员的工作方式不变,流程看起来与以往完全相同。自定义实体在 MCP 配置中设置一次,此后所有 API 调用均享有完整的实体检测。
DPO 实施清单
1. 梳理所有 AI 数据流向。
列出客服人员使用 AI 的所有场景,包括浏览器工具、API 集成工具和文件上传。
2. 列举客户消息中出现的所有标识符类型。
标准 PII(姓名、电子邮件、电话)默认已覆盖。自定义标识符(订单编号、工单编号、账户号码)需要自定义模式。
3. 添加自定义实体模式。
定义每种格式,对照样本消息进行测试,保存到团队预设。
4. 在正确的层次部署。
基于浏览器的 AI:使用 Chrome 扩展配合共享预设。API 集成的 AI:使用 MCP 服务器或 API 层预处理。
5. 更新 ROPA 记录。
记录客服 AI 使用了自动匿名化处理,列出已覆盖的自定义标识符类型,这是你的技术保障措施文档。
6. 测试整套流程。
使用包含所有标识符类型的样本消息进行测试,确认没有任何内容到达 AI。参阅法律合规指南获取文档模板。
SaaS 客服团队实践案例
一个 SaaS 客服团队通过内部 AI 平台使用 Claude,客户消息包含姓名、电子邮件、订单编号和订阅 ID,部分功能标志名称也携带内部标识符。
GDPR 审查前: 所有内容直接发送给 AI,包含订单和订阅 ID。
部署自定义实体检测后:
ORD-XXXXXXX 和 SUB-XXXXXXXX 被添加为自定义实体,Chrome 扩展以共享预设形式部署,DPO 测试后确认所有标识符在 AI 处理前均已移除。
客服工作流变化: 没有任何变化。客服人员操作方式不变,匿名化在后台运行,DPO 存档了有据可查的合规保障措施。
结语
符合 GDPR 的客服 AI 不仅仅是过滤姓名和电子邮件。订单编号、账户号码和工单编号同样属于个人数据,标准工具会遗漏它们,自定义实体配置能够填补这一漏洞。
步骤很简单:定义你的标识符格式,对照样本消息进行测试,部署给团队。DPO 只需一个下午即可完成。此后,所有客户数据在到达外部 AI 系统之前均已移除,合规保障从此持续生效。