anonym.legal

By · Last updated 2026-03-05

กลับไปที่บล็อกเทคโนโลยีทางกฎหมาย

ไฟล์ Epstein: การไฮไลต์ไม่ใช่การลบข้อมูล

การเผยแพร่ไฟล์ Epstein ของกระทรวงยุติธรรมสหรัฐฯ เดือนธันวาคม 2025 เปิดเผยความล้มเหลวร้ายแรงของการลบข้อมูล: ข้อความ PDF ที่ไฮไลต์สีดำยังสามารถอ่านได้โดยการคัดลอก-วาง

March 5, 20267 อ่านประมาณ
document redactionPDF redaction failurelegal complianceWord redaction

ความล้มเหลวของการลบข้อมูลในเดือนธันวาคม 2025

อัปเดตสำหรับปี 2026

กระทรวงยุติธรรมสหรัฐฯ เผยแพร่ไฟล์ Epstein ในเดือนธันวาคม 2025 ความสนใจจากสื่อเปลี่ยนจากเนื้อหาไปสู่การลบข้อมูลอย่างรวดเร็ว โดยเน้นไปที่ว่าการลบข้อมูลเหล่านั้นสามารถหลีกเลี่ยงได้ง่ายเพียงใด

วิธีการนั้นง่ายมาก เนื้อหาที่ "ลบแล้ว" ในไฟล์ PDF ถูกทำให้เป็นสีดำด้วยการไฮไลต์ แต่คำยังคงอยู่ในชั้นข้อความของ PDF คัดลอกกล่องสีดำลงในโปรแกรมแก้ไขข้อความและคำดั้งเดิมจะปรากฏขึ้น การปกปิดด้วยภาพไม่ใช่การลบจริง ข้อมูลที่ละเอียดอ่อนไม่เคยถูกลบออก

นี่ไม่ใช่ข้อบกพร่องใหม่ คดี Anthony Pellicano ปี 2007 มีการเปิดเผยข้อมูลที่ละเอียดอ่อนผ่านการลบข้อมูลที่ไม่เหมาะสมในเอกสารทางกฎหมาย ความล้มเหลวเดียวกันปรากฏในเอกสารของศาลและรายงานของรัฐบาลมาหลายปี แต่ไฟล์ Epstein ทำให้ความล้มเหลวนี้มองเห็นได้แก่คนหลายสิบล้านคนในเวลาจริง

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการลบข้อมูลระบุตัวตนของเอกสารในบริบททางกฎหมาย ดู ภาพรวมการปฏิบัติตามข้อกำหนดของเรา

การปกปิดด้วยภาพ vs. การลบจริง

ทำไมสิ่งนี้ถึงเกิดขึ้นซ้ำแล้วซ้ำเล่า? คำตอบอยู่ที่ช่องว่างทางเทคนิคที่สำคัญ มีความแตกต่างระหว่างการปกปิดด้วยภาพและการลบจริง

การปกปิดด้วยภาพ วางองค์ประกอบไว้เหนือคำ ไม่ได้ลบคำเหล่านั้นออกจากไฟล์ วิธีการเหล่านี้ล้วนอยู่ในกลุ่มนี้ การไฮไลต์สีดำตั้งพื้นหลังเป็นสีดำ คำสีขาวบนหน้าสีขาวเปลี่ยนสีให้ตรงกัน สี่เหลี่ยมสีดำที่วาดทับข้อความซ่อนมุมมอง การปกคลุมด้วยคำอธิบายประกอบ PDF เพิ่มชั้นทึบแสงไว้ด้านบน การซ้อนทับรูปภาพวางภาพสีดำไว้เหนือคำ

ในทุกกรณี คำดั้งเดิมยังคงอยู่ในไฟล์ สามารถค้นพบได้โดยการคัดลอกบริเวณหรือลบการซ้อนทับ บุคคลที่มีทักษะทางเทคนิคยังสามารถสแกนไฟล์ดิบได้

การลบจริง ลบคำออกจากไฟล์อย่างถาวร เนื้อหาไม่ได้ถูกซ่อน มันหายไป ไม่มีอะไรเหลือให้ค้นหา

คำถามสำคัญสำหรับไฟล์ใดก็ตามที่คุณส่งออก: เมื่อมีคนตรวจสอบไฟล์นี้ พวกเขาจะพบคำดั้งเดิมหรือไม่? ด้วยการปกปิดด้วยภาพ คำตอบคือใช่ ดู อภิธานศัพท์ของเรา สำหรับคำจำกัดความของคำศัพท์การลบข้อมูล

ปัญหาเอกสาร Word

ความล้มเหลวเดียวกันมีอยู่ใน Microsoft Word การใช้การไฮไลต์สีดำหรือกล่องทึบแสงเพื่อ "ลบ" ไฟล์ Word ทิ้งคำดั้งเดิมไว้ใน XML ของเอกสาร

สิ่งนี้สำคัญเพราะ Word เป็นรูปแบบหลักสำหรับจดหมายทางกฎหมาย สัญญา ไฟล์ HR และการทบทวนภายใน กลุ่มที่ใช้การไฮไลต์ได้ส่งบันทึกพร้อมข้อมูลที่สามารถค้นพบได้ตลอดประวัติของพวกเขา

71% ของทีมกฎหมายใช้เครื่องมือ AI แม้จะมีข้อกังวลเรื่องการจัดเก็บข้อมูล (การสำรวจ ACC 2025) เมื่อเครื่องมือ AI เข้าสู่งานเอกสาร ความเสี่ยงของการค้นพบความล้มเหลวของการลบข้อมูลในอดีตเพิ่มขึ้น AI ที่อ่านไฟล์ของคุณอาจพบคำในส่วน "ที่ลบแล้ว" ที่ไม่เคยถูกลบจริงๆ

ความล้มเหลวของการลบข้อมูลที่มีชื่อเสียง

ไฟล์ Epstein ไม่ใช่กรณีแรกที่มีชื่อเสียงของความล้มเหลวนี้

คดี Anthony Pellicano (2007) เกี่ยวข้องกับข้อมูลที่ละเอียดอ่อนที่เปิดเผยผ่านเอกสารที่ลบข้อมูลไม่เหมาะสมที่ยื่นในศาลรัฐบาลกลาง [VERIFIED-EXTERNAL]

เอกสาร NSA ที่เผยแพร่ผ่านคำขอ FOIA มีคำที่อ่านได้ซ้ำๆ ภายใต้กล่องสีดำ นักวิจัยด้านความปลอดภัยได้บันทึกสิ่งนี้ในการเผยแพร่ด้านความมั่นคงแห่งชาติ [VERIFIED-EXTERNAL]

การยื่นฟ้องคดีของบริษัท มักมีเนื้อหาที่อ่านได้เมื่อฝ่ายต่างๆ ใช้ชั้นคำอธิบายประกอบ PDF แทนการลบจริง [VERIFIED]

รูปแบบนี้แสดงช่องว่างพื้นฐาน ทีมกฎหมายมองการลบข้อมูลเป็นการกระทำด้านภาพ แต่รูปแบบ PDF และ Word มีข้อมูลที่มีโครงสร้างไม่ว่าคุณจะเห็นอะไรบนหน้าจอ

สิ่งที่การลบข้อมูลจริงต้องการ

เพื่อให้ไฟล์ถูกลบข้อมูลอย่างแท้จริง คำต้องถูกลบและแทนที่ บุคคลที่มีทักษะต้องไม่สามารถกู้คืนได้

ในไฟล์ PDF การลบข้อมูลจริงหมายถึงสี่สิ่ง หนึ่ง: แบนราบ PDF เพื่อลบชั้นที่แก้ไขได้ทั้งหมด สอง: แทนที่เนื้อหาด้วยกล่องสีดำที่ระดับสตรีมเนื้อหา สาม: ลบข้อมูลเมตาที่อาจมีคำดั้งเดิม สี่: ลบฟอนต์ที่ฝังตัวซึ่งอาจทำให้กู้คืนได้

ในไฟล์ Word การลบข้อมูลจริงหมายถึงสามสิ่ง หนึ่ง: ค้นหาทุกอินสแตนซ์ของเนื้อหาเป้าหมาย ในการเปลี่ยนแปลงที่ติดตาม ความคิดเห็น ข้อมูลเมตา และประวัติการแก้ไข สอง: แทนที่เนื้อหา ไม่ใช่ปกปิดด้วยภาพ สาม: รักษารูปแบบโดยไม่ทิ้งร่องรอย

คำสำคัญคือ การแทนที่ เนื้อหาดั้งเดิมต้องถูกแทนที่ด้วยสิ่งอื่น ไม่ใช่ซ่อนไว้ใต้สิ่งอื่น

ส่วนหัว ส่วนท้าย และโซนที่ซ่อนอยู่

การลบข้อมูลเอกสารทางกฎหมายมีหลายชั้นมากกว่าแค่เนื้อหาหลัก ข้อมูลที่ละเอียดอ่อนมักปรากฏในโซนที่เครื่องมือภาพพลาดไปโดยสิ้นเชิง

ส่วนหัวและส่วนท้าย มักมีชื่อเรื่อง ID ลูกค้า และหมายเลขเอกสาร การทำให้เนื้อหาสัญญาเป็นสีดำในขณะที่ปล่อย "Privileged — Re: TechCorp" ไว้ในส่วนหัวทำให้เป้าหมายล้มเหลว

ความคิดเห็นและการเปลี่ยนแปลงที่ติดตาม เป็นแหล่งทั่วไปของการเปิดเผยโดยไม่ตั้งใจ ผู้ตรวจสอบที่ความคิดเห็น "ดูบันทึกของ John Smith" ทิ้งสิ่งนั้นไว้ในไฟล์ มันอยู่แม้หลังจากข้อที่เกี่ยวข้องถูกปกคลุม

คุณสมบัติเอกสารและข้อมูลเมตา มีชื่อผู้แต่งและประวัติการแก้ไข สิ่งเหล่านี้สามารถเปิดเผยต้นกำเนิดของเอกสารแม้เนื้อหาหลักจะเป็นสีดำ

ประวัติการแก้ไข ใน Word รักษาเวอร์ชันก่อนหน้าของเนื้อหาที่แก้ไข ไฟล์ที่เคยพูดว่า "ที่อยู่บ้านของโจทก์คือ 123 Main Street" เก็บเวอร์ชันนั้นไว้ มันอยู่เว้นแต่คุณจะล้าง

การสร้างกระบวนการที่สอดคล้องข้อกำหนด

เมื่อพิจารณาโหมดความล้มเหลวเหล่านี้ กระบวนการลบข้อมูลที่ดีต้องการสี่ขั้นตอน

1. ใช้การรวม Word แบบเนทีฟสำหรับไฟล์ Word การลบข้อมูลภายในโมเดลวัตถุ Word แทนที่เนื้อหาโดยตรงในไฟล์ หลีกเลี่ยงปัญหาการปกปิด การแปลงเป็น PDF ก่อนเพิ่มความเสี่ยงและอาจพลาดความคิดเห็นและประวัติการแก้ไข

2. ประมวลผลโซนเอกสารทั้งหมด กระบวนการที่สอดคล้องข้อกำหนดต้องจัดการส่วนหัว ส่วนท้าย เชิงอรรถ หมายเหตุท้ายเรื่อง ความคิดเห็น การเปลี่ยนแปลงที่ติดตาม และคุณสมบัติเอกสาร ไม่ใช่แค่เนื้อหาหลัก

3. ตรวจสอบผลลัพธ์ หลังการลบข้อมูล พยายามกู้คืนเนื้อหา คัดลอก-วางพื้นที่ที่ลบ ตรวจสอบ XML ของเอกสาร ทบทวนการเปลี่ยนแปลงที่ติดตามและประวัติการแก้ไข หากเนื้อหาดั้งเดิมปรากฏที่ใด การลบข้อมูลไม่สมบูรณ์

4. รักษาเส้นทางการตรวจสอบ สำหรับการผลิตทางกฎหมาย บันทึกสิ่งที่ถูกลบ โดยวิธีใด และโดยใคร สิ่งนี้สำคัญหากเกิดข้อพิพาทเรื่องสิทธิ์ความลับ เรียนรู้เพิ่มเติมที่ หน้าความปลอดภัยและการปฏิบัติตามข้อกำหนดของเรา

บทเรียนจากไฟล์ Epstein

ความล้มเหลวของไฟล์ Epstein เป็นบทเรียนสาธารณะ มันแสดงให้เห็นว่าเกิดอะไรขึ้นเมื่อการปกปิดด้วยภาพถูกสับสนกับการลบข้อมูลจริง

ทุกทีมกฎหมายและผู้เชี่ยวชาญด้านการปฏิบัติตามข้อกำหนดที่ติดตามเรื่องนี้ควรถามสองคำถาม หนึ่ง: มีอะไรในการผลิตเอกสารในอดีตของเราที่สามารถกู้คืนได้ในลักษณะเดียวกัน? สอง: กระบวนการปัจจุบันของเราลบเนื้อหาจริงหรือเพียงแค่ปกคลุม?

คำตอบกำหนดการเปิดรับที่แท้จริง ไม่ใช่แค่การมีนโยบายการลบข้อมูล


Office Add-in ของ anonym.legal ทำการแทนที่ PII จริงภายในไฟล์ Word มันแทนที่เนื้อหาโดยตรงในโครงสร้างเอกสาร ไม่ใช่ปิดคลุมด้วยภาพ ส่วนหัว ส่วนท้าย เชิงอรรถ ความคิดเห็น และการเปลี่ยนแปลงที่ติดตามทั้งหมดได้รับการประมวลผล ผลลัพธ์คือไฟล์ที่ข้อมูลดั้งเดิมไม่มีอยู่ ไม่ใช่ซ่อนอยู่ เรียนรู้เพิ่มเติม

แหล่งข้อมูล

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

เริ่มทำให้ PII เป็นนิรนามด้วยประเภทเอนทิตีมากกว่า 285 ประเภทใน 48 ภาษา.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.