By · Last updated 2026-06-02

返回博客人工智能安全

GDPR 与客服 AI:自定义标识符不可忽视

客服 AI 接收的客户消息中包含姓名、电子邮件以及订单编号。标准 PII 工具能过滤电子邮件,却对订单编号视而不见。

June 2, 20267 分钟阅读
customer support AIGDPR AI complianceorder ID detectionIntercom GDPRZendesk privacyAI vendor data

GDPR 与客服 AI:自定义标识符同样重要

你的客服团队使用 AI 起草回复、审核工单,效率大幅提升。然而当 DPO 审查这套流程时,问题浮出水面。

一条典型的客户消息包含姓名、电子邮件地址和订单编号。姓名和电子邮件是个人数据,订单编号同样如此。它与订单数据库中的 Sarah Johnson 直接关联,AI 供应商可交叉比对,一旦训练数据泄露,该编号便可重新识别当事人。

在没有合法依据的情况下,将上述任何信息发送给外部 AI 供应商,均构成 GDPR 违规。

为何订单编号属于个人数据

GDPR 第 4 条对个人数据的定义极为宽泛,涵盖一切与已识别或可识别自然人相关的信息,包括通过标识符进行的间接识别。

像 ORD-4521893 这样的订单编号是一种间接标识符。单独来看,它并不指向 Sarah Johnson,但与你的订单数据库结合,便能精准定位当事人。

GDPR 第 4 条第 5 款涉及假名化处理。订单编号即为假名,需借助第二个数据源才能还原背后的自然人。当你将其发送给外部 AI 供应商时,即等同于共享了个人数据,需要合法依据和数据处理协议作为前提。

即便供应商未持有你的数据库,你的合规义务也不因此消除。个人数据已被共享,GDPR 依然适用。

标准匿名化的盲区

客服团队通常为 GDPR 合规部署 PII 检测。标准工具可移除常见实体类型。

标准检测能识别客户姓名、电子邮件地址、电话号码和信用卡号,这些均可通过。

标准检测无法识别 ORD-XXXXXXX 格式的订单编号,也会遗漏账户号码、工单编号、内部用户 ID 和订阅 ID,这些均会漏检。

结果看起来是这样的:「您好,我是**[PERSON_1],我的订单 ORD-4521893 还没有收到,请发邮件至[EMAIL_1]**。」

订单编号依然存在。任何有权访问 CRM 的人都能立即找到 Sarah Johnson。匿名化并不完整,这就是合规漏洞所在。

Chrome 扩展:在浏览器层阻断

使用 Claude、ChatGPT 或 Gemini 的客服人员在浏览器中工作。Chrome 扩展能在自定义标识符离开本地之前将其拦截。

工作方式如下:客服人员将客户消息粘贴到 AI 工具,扩展识别到目标为 AI 平台,先移除标准 PII,再应用自定义模式,这些模式匹配你的订单编号格式、账户号码格式以及团队使用的任何其他自定义标识符。客服人员只看到干净的消息内容,原始数据从未到达 AI 端。

合规团队只需配置一次自定义模式,以预设形式共享给所有客服人员。客服无需自行管理,粘贴消息,扩展自动处理,流程不变。

MCP 服务器:在 API 层阻断

部分平台通过 API 调用 AI,例如 Intercom 用 AI 起草回复,Zendesk 用 AI 生成回复建议。MCP 服务器为此类集成在 API 层添加匿名化处理。

流程如下:客户消息进入客服平台,在到达 AI 之前经过 MCP 端点处理,端点移除标准和自定义实体,干净的消息发送给 AI,AI 返回回复内容,整个过程中没有个人数据被共享,客服人员随后在平台中查看并编辑回复。

客服人员的工作方式不变,流程看起来与以往完全相同。自定义实体在 MCP 配置中设置一次,此后所有 API 调用均享有完整的实体检测。

DPO 实施清单

1. 梳理所有 AI 数据流向。

列出客服人员使用 AI 的所有场景,包括浏览器工具、API 集成工具和文件上传。

2. 列举客户消息中出现的所有标识符类型。

标准 PII(姓名、电子邮件、电话)默认已覆盖。自定义标识符(订单编号、工单编号、账户号码)需要自定义模式。

3. 添加自定义实体模式。

定义每种格式,对照样本消息进行测试,保存到团队预设。

4. 在正确的层次部署。

基于浏览器的 AI:使用 Chrome 扩展配合共享预设。API 集成的 AI:使用 MCP 服务器或 API 层预处理。

5. 更新 ROPA 记录。

记录客服 AI 使用了自动匿名化处理,列出已覆盖的自定义标识符类型,这是你的技术保障措施文档。

6. 测试整套流程。

使用包含所有标识符类型的样本消息进行测试,确认没有任何内容到达 AI。参阅法律合规指南获取文档模板。

SaaS 客服团队实践案例

一个 SaaS 客服团队通过内部 AI 平台使用 Claude,客户消息包含姓名、电子邮件、订单编号和订阅 ID,部分功能标志名称也携带内部标识符。

GDPR 审查前: 所有内容直接发送给 AI,包含订单和订阅 ID。

部署自定义实体检测后:

ORD-XXXXXXX 和 SUB-XXXXXXXX 被添加为自定义实体,Chrome 扩展以共享预设形式部署,DPO 测试后确认所有标识符在 AI 处理前均已移除。

客服工作流变化: 没有任何变化。客服人员操作方式不变,匿名化在后台运行,DPO 存档了有据可查的合规保障措施。

结语

符合 GDPR 的客服 AI 不仅仅是过滤姓名和电子邮件。订单编号、账户号码和工单编号同样属于个人数据,标准工具会遗漏它们,自定义实体配置能够填补这一漏洞。

步骤很简单:定义你的标识符格式,对照样本消息进行测试,部署给团队。DPO 只需一个下午即可完成。此后,所有客户数据在到达外部 AI 系统之前均已移除,合规保障从此持续生效。

参考资料

准备好保护您的数据了吗?

开始使用 285 种实体类型在 48 种语言中匿名化 PII。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.