返回博客法律科技

Excel与GDPR:电子表格中隐藏的数据暴露风险(及其解决方案)

GDPR访问权请求从2021年到2024年增加了180%(EDPB)。平均每个DSAR处理手动需要12小时。管理100,000行员工电子表格的人力资源部门无法为外部顾问手动匿名——这是一个实用的解决方案。

April 7, 20268 分钟阅读
Excel GDPR anonymizationspreadsheet redactionDSAR processingEDPB right of accessHR data compliance

电子表格合规差距

PDF编辑工具无法处理Excel电子表格。这个单一事实为以Excel格式存储个人数据的组织创造了一个系统性的合规差距——在企业环境中,这意味着几乎每个HR部门、财务团队和运营部门。

EDPB的年度报告数据显示,GDPR访问权请求从2021年到2024年增加了180%。收到DSAR的组织必须以可移植格式提供请求者的个人数据,同时确保同一数据集中包含的第三方数据得到适当保护。对于存储在Excel中的员工数据集,标准响应——导出特定行——仍然会暴露同一文件中其他员工的数据。适当的DSAR合规要求对非请求者数据进行逐条记录的匿名化。

平均每个DSAR手动处理需要12小时。对于每月收到200个DSAR的组织——对于中型公司来说,这个数量是适中的——这代表着每月2,400个员工小时的合规开销。手动处理方法无法满足EDPB数据预计在本十年剩余时间内的请求量。

Excel匿名化实际上需要什么

电子表格匿名化面临PDF编辑工具无法处理的挑战。

隐藏行和列: Excel文件通常包含隐藏行(草稿数据、过滤掉的记录)和隐藏列(中间计算、转换前的原始值)。仅处理可见单元格的编辑工具会保留隐藏的个人身份信息。合规级别的Excel匿名化工具必须处理所有工作表,包括隐藏的工作表。

嵌入公式: 包含引用其他单元格中个人身份信息的公式的单元格可能显示派生值,而公式本身引用原始数据。在不更新公式引用的情况下匿名化显示值,会使原始个人身份信息对任何检查公式的人可访问。

数据透视表缓存: Excel数据透视表缓存用于生成数据透视表的基础数据。匿名化源数据表不会自动清除数据透视表缓存。收到“匿名化”Excel文件的对手用户可以检查数据透视表缓存以恢复原始数据。

跨工作表引用: 企业Excel文件通常包含跨工作表的单元格引用。员工的姓名可能出现在工作表1上,并在工作表3的计算中被引用。在不更新工作表3引用的情况下匿名化工作表1,会留下对匿名数据的引用,这可能通过公式检查揭示原始值。

人力资源部门用例

一家德国制造公司必须与外部薪酬顾问分享50,000条员工记录,以进行基准项目。GDPR第28条要求与处理者(外部顾问)共享个人数据时涉及适当的技术控制。Excel文件包含37列,包括姓名、个人电子邮件地址、家庭地址、薪水、绩效评级和病假记录。

在任何合规时间框架内,手动匿名化50,000行跨37列的数据都是不可行的。Word和Excel插件在Microsoft Excel内本地处理电子表格,无需导出或转换。单元格级别的个人身份信息检测识别所有可见和隐藏工作表中的个人数据。姓名被替换为假名;地址被替换为适当类型的占位符;薪水保留(不是个人身份信息),而相关的个人标识符被移除。匿名化在几分钟内处理50,000行,而不是几天。

每个实体的配置允许对不同数据类型进行不同处理:姓名被替换为一致的假名(不同单元格中的相同姓名获得相同假名,保留分析效用);社会安全号码被替换为掩码字符串;地址被替换为仅城市的近似值;个人电子邮件地址被替换为基于角色的占位符。

来源:

准备好保护您的数据了吗?

开始使用 285 种实体类型在 48 种语言中匿名化 PII。