2025年12月的编辑失败
当美国司法部在2025年12月发布爱泼斯坦文件时,媒体的关注迅速从文件内容转向其编辑,尤其是这些编辑是多么容易被绕过。
机制很简单:在PDF文件中使用黑色高亮"编辑"的文本仍然存在于PDF的文本层中。将黑框复制到文本编辑器中,底层文本就会出现。视觉上的隐藏并不是文本的删除。敏感信息从未被删除。
这并不是一个新漏洞。2007年的安东尼·佩利卡诺案件涉及通过不当编辑在法律文件中揭露的敏感信息。在此后的几年中,法院文件、政府报告和公司文件制作中都出现了同样的失败模式。然而,由于爱泼斯坦文件的知名度,这一失败向数千万实时关注这一事件的人们暴露了出来。
视觉隐藏与真正的编辑
理解为什么这种情况不断发生需要理解隐藏与删除之间的技术区别。
视觉隐藏是在文本上放置一个视觉元素,而不从文件结构中删除文本。属于这一类别的方法有:
- 黑色文本高亮(将文本背景设置为黑色)
- 白色文本在白色背景上(将文本颜色更改为与背景匹配)
- 在文本上绘制黑色矩形形状
- PDF注释覆盖(添加不透明的注释元素)
- 图像覆盖(在文本上放置黑色图像)
在上述每种情况下,原始文本仍然保留在文件中。可以通过复制隐藏区域、移除覆盖元素或检查原始文件结构来恢复。
真正的编辑是永久性地从文件中删除底层文本。文本并不是隐藏的——它消失了。没有任何东西可以恢复。
对于任何离开您控制的文件,关键问题是:当具有技术知识的人检查此文件时,他们会找到原始文本吗?对于视觉隐藏,答案是肯定的。
Word文档问题
同样的失败模式也存在于Microsoft Word中。使用黑色文本高亮、白色文本颜色或不透明文本框来"编辑"Word文档会使原始文本在文档的XML结构中保持不变。
这很重要,因为Word文档是法律通信、合同、证人陈述、人力资源文件和内部调查的主要格式。那些使用高亮编辑Word文档的组织在这些文档的分发历史中一直在制作可恢复内容的文档。
71%的法律团队使用生成性AI工具,尽管存在数据驻留问题(ACC 2025)。随着AI工具成为文档工作流程的一部分,发现过去编辑失败的风险增加——处理文档的AI工具可能会显示"编辑"部分中实际上未被删除的文本。
高调的编辑失败实例
爱泼斯坦文件并不是这种失败模式的第一个高调实例。
**安东尼·佩利卡诺案件(2007)**涉及通过不当编辑在联邦法院提交的法律文件中揭露的敏感信息。
通过FOIA请求发布的NSA文件反复被发现包含可读文本,黑框下的文本由于PDF编辑失败而可读——这一问题被安全研究人员和分析国家安全文件发布的记者记录。
公司诉讼文件在提交方使用PDF评论或注释层而不是实际内容删除时,常常包含无意中可读的编辑内容。
这种失败模式的一致性反映了法律专业人士在概念上对编辑(作为一种视觉行为)与PDF和Word文档格式实际工作方式(作为包含文本的结构化数据,无论视觉呈现如何)之间的根本差距。
真正的编辑所需
要使文档真正编辑——以至于技术能力强的接收者无法恢复原始内容——必须从文件结构中删除底层文本并进行替换。
在PDF文档中,真正的编辑要求:
- 扁平化PDF以移除所有可编辑层
- 在内容流级别用黑色矩形或编辑标记替换文本内容
- 移除可能包含原始文本的元数据
- 移除可能启用文本重建的嵌入字体
在Word文档中,真正的编辑要求:
- 找到每个要删除的文本实例(包括在跟踪更改、评论、修订历史、元数据和嵌入对象中)
- 替换文本内容,而不是视觉上覆盖
- 保留文档格式,而不留下指示已删除内容的伪影
关键字是替换:原始文本必须被其他内容替换,而不是被隐藏在其他内容下。
页眉、页脚和评论问题
法律文档编辑在主要文本主体之外还有额外的复杂性。敏感信息出现在视觉编辑工具常常完全忽略的位置:
页眉和页脚经常包含事项名称、客户标识符、机密标识和文档控制编号。在合同正文中进行黑色高亮,而在页眉中留下"特权和机密——关于TechCorp/MegaStartup收购",就违背了这一工作的目的。
评论和跟踪更改是一种持续的无意泄露来源。评论员如果评论"请参见约翰·史密斯关于这一条款的证词",即使该条款本身被"编辑",也会在文档中留下该评论。
文档属性和元数据包含作者姓名、公司名称、修订历史和摘要信息,即使内容被编辑,也能识别文档的来源。
Word文档中的修订历史保留已编辑文本的先前版本。一个文档如果说"原告的家庭地址是123主街",然后编辑为"原告的地址",除非明确清除该历史,否则在修订历史中保留原始版本。
建立合规的编辑流程
鉴于上述失败模式,合规的编辑流程要求:
1. 对于Word文档使用本地Word集成:在Word文档对象模型内工作的编辑——直接在文档结构中替换文本内容——是避免隐藏与删除问题的唯一方法。转换为PDF并编辑PDF引入格式转换风险,并可能无法正确处理评论、跟踪更改或修订历史。
2. 处理所有文档区域:任何合规的编辑流程必须包括对页眉、页脚、脚注、尾注、评论、跟踪更改和文档属性的明确处理——而不仅仅是主要正文文本。
3. 验证输出:编辑后,通过尝试恢复编辑内容来验证结果。复制编辑区域。打开文档的XML结构。检查跟踪更改和修订历史。如果原始内容在任何地方出现,则编辑不完整。
4. 保持审计记录:对于法律制作,记录编辑了什么,使用了什么方法,以及由谁编辑。如果出现特权争议或编辑挑战,这将变得相关。
爱泼斯坦文件作为教学时刻
爱泼斯坦文件的编辑失败对司法部来说是尴尬的,但它提供了一个具体的、公开可见的示范,展示了当视觉隐藏与真正的编辑混淆时会发生什么。
每个法律团队、政府机构和合规专业人士都应该问:我们组织过去的文档制作中有什么内容可能被类似恢复?我们当前的编辑流程是什么,是否真的删除文本,还是仅仅隐藏文本?
这些问题的答案决定了实际的暴露,而不是编辑政策的存在。
anonym.legal的Office插件在Word文档中执行真正的PII替换——直接在文档结构中替换文本内容,而不是视觉上覆盖。页眉、页脚、脚注、评论和跟踪更改都被处理。结果是一个原始文本缺失而非隐藏的文档。
来源: