审计人员关于个人数据管控的追问

GDPR 和 ISO 27001 审计人员会提出一个标准问题：「您的个人数据匿名化有哪些管控措施？」

他们期待的是一个清晰的答案：一套管控措施，以同样的方式贯彻执行，有文档记录，有证据支撑。

危险的答案听起来是这样的：「视情境而定——Chrome 浏览器用扩展程序，法律文件用 Word 宏，批量文件用 Python 脚本，紧急请求用网页应用。」

这个答案只会引发更多追问：「这些工具之间存在哪些覆盖漏洞？审计追踪在哪里？」

工具碎片化无法回答这些问题，这正是合规风险所在。

覆盖一致性问题

不同的个人数据工具采用不同的检测方法，结果差异显著。

纯正则表达式工具只搜索固定模式：社会安全号格式、邮箱格式、信用卡格式。它们会遗漏基于命名实体识别（NER）的实体——人名和非美国格式无从检测。

纯 NER 工具通过训练模型识别实体类型，但会遗漏基于模式的实体——IBAN 和自定义标识符在不包含于训练数据的情况下将直接漏过。

每款工具实体覆盖范围各异，置信度阈值各不相同。同一份文件经过工具 A 和工具 C 处理可能得出不同结果。

这直接产生合规漏洞：工具 A 用于处理 PDF，工具 B 用于处理 Excel；工具 A 能检测出生日期，工具 B 不能。同一个人的出生日期在 PDF 中被匿名化，在 Excel 文件中却暴露无遗。

这一漏洞取决于文件格式，而非政策，更非初衷。

数据保护局（DPA）调查人员可能在违规调查中发现这一漏洞，工具不一致性将成为数据暴露的因素之一。GDPR 第 32 条要求采取系统性技术措施。

审计追踪问题

合规需要管控措施持续执行的证据。对于个人数据匿名化而言，该证据就是审计追踪记录。

四款工具产生四种不同的日志格式，有些甚至根本不产生日志。

Word 宏不创建审计记录；Python 脚本可能写入本地文件，但该文件未与合规系统关联；Chrome 扩展程序可能写入浏览器端日志，但这些日志无法用于合规审查。

当 DPA 调查要求提供审计证据时，只有一种答案是有效的：一份覆盖所有平台全部匿名化处理的集中日志。

其他答案行不通。开发者本地机器上 Word 宏产生的日志，不足以作为合规证明。

单一平台处理使集中审计追踪成为可能，工具碎片化则令其无从实现。

有关审计追踪要求的详细说明，请参阅可解释脱敏与 HIPAA 审计追踪。

配置漂移问题

随着时间推移，不同工具的配置会逐渐产生偏差，这一过程往往悄无声息。

常见情形如下：Chrome 扩展程序新增了自定义实体类型，而 Python 脚本未同步更新；Word 宏由已离职的团队成员配置，当前设置无人知晓；网页应用预设被修改为排除承包商姓名，但这一变更从未传达到其他工具。

更新某一工具而不同步其他工具，就会产生配置漂移；漂移日积月累，终将导致覆盖漏洞。

ISO 27001 审计人员要求提供配置文档。「我们有四套工具、四套配置，也不确定是否是最新的」——这个答案站不住脚。ISO/IEC 27001:2022 附录 A 8.11（数据脱敏）要求有据可查、持续一致的管控措施；参见 ISO/IEC 27001:2022。

ISO 27001 实际发现案例

某家 15 人合规公司使用四套工具：网络数据采集工具、Windows 桌面批量文件处理工具、法律文件处理 Word 宏，以及 AI 工具 Chrome 扩展程序。

ISO 27001 审计产生了一项发现：跨平台检测结果不一致，缺乏集中审计追踪，存在附录 A 8.11 漏洞，管控措施无法证明持续一致地执行。这与 ISO 27001 附录 A 8.11 不符合项的有据可查模式相吻合。

该发现要求制定纠正行动计划，纠正行动的核心是平台整合。

整合后，公司在四个平台上使用同一个检测引擎，每个场景都应用相同的预设，所有处理记录集中归档于一处。ISO 27001 发现项在下次审计中成功关闭。

整个项目历时六周，将长达 12 页的纠正行动回应浓缩为一个已关闭的发现项。

关于一致性匿名化如何支持 GDPR 审计就绪，请参阅匿名化一致性、预设与 GDPR 审计。

合规叙述测试

以下四个问题，您能毫不迟疑地回答吗？

团队使用的每个平台检测了哪些实体类型？
每种实体类型在所有平台上的检测阈值是否完全一致？
过去 12 个月所有匿名化操作的集中审计追踪记录在哪里？
如何确保配置变更在所有平台上同步应用？

如果任何一个问题令您迟疑，工具碎片化就正在制造合规风险。

这四个问题都有明确答案，但前提是在所有平台上使用同一个引擎。否则，每款工具都会形成自己的覆盖漏洞、审计记录孤岛和配置漂移。

审计人员会注意到这些漏洞，DPA 调查人员可以利用它们。在审计发现之前主动整合，远比事后补救容易得多。

关于工具碎片化如何影响跨平台 GDPR 管控，请参阅 GDPR 审计与跨平台个人数据工具碎片化。

参考资料

准备好保护您的数据了吗？

开始使用 285 种实体类型在 48 种语言中匿名化 PII。

开始免费试用查看功能

个人数据工具碎片化导致合规审计失败

审计人员关于个人数据管控的追问

覆盖一致性问题

审计追踪问题

配置漂移问题

ISO 27001 实际发现案例

合规叙述测试

参考资料

相关文章

自托管 PII 工具为何无法通过合规审计

Presidio遗漏220余种GDPR实体：欧盟覆盖缺口

配置漂移：隐藏的GDPR合规风险

准备好保护您的数据了吗？

个人数据工具碎片化导致合规审计失败

审计人员关于个人数据管控的追问

覆盖一致性问题

审计追踪问题

配置漂移问题

ISO 27001 实际发现案例

合规叙述测试

参考资料

相关文章

自托管 PII 工具为何无法通过合规审计

Presidio遗漏220余种GDPR实体：欧盟覆盖缺口

配置漂移：隐藏的GDPR合规风险

准备好保护您的数据了吗？

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow