By · Last updated 2026-03-05

블로그로 돌아가기법률 기술

엡스타인 파일: 강조 표시는 편집이 아닙니다

2025년 12월 DOJ의 엡스타인 파일 공개는 치명적인 편집 실패를 드러냈습니다. PDF에서 검은색으로 강조 표시된 텍스트는 복사-붙여넣기로 읽을 수 있습니다.

March 5, 20267 분 읽기
document redactionPDF redaction failurelegal complianceWord redaction

2025년 12월의 편집 실패

2026년 업데이트

미국 법무부는 2025년 12월 엡스타인 파일을 공개했습니다. 뉴스 보도는 빠르게 내용에서 편집으로 전환되었습니다. 편집이 얼마나 쉽게 우회될 수 있는지에 집중했습니다.

방법은 간단했습니다. PDF 파일의 "편집된" 내용은 강조 표시로 검게 가려졌습니다. 하지만 단어들은 PDF의 텍스트 레이어에 남아 있습니다. 검은 상자를 텍스트 편집기에 복사하면 원본 단어들이 나타납니다. 시각적 가림막은 진정한 삭제가 아니었습니다. 민감한 데이터는 제거된 적이 없었습니다.

이것은 새로운 결함이 아닙니다. 2007년 Anthony Pellicano 사건에서는 연방 법원에 제출된 법률 서류의 부적절한 편집을 통해 민감한 데이터가 공개되었습니다. 같은 실패가 수년간 법원 서류와 정부 보고서에서 나타났습니다. 하지만 엡스타인 파일은 이 실패를 수천만 명에게 실시간으로 가시화했습니다.

법률 맥락의 문서 비식별화에 대한 자세한 내용은 컴플라이언스 개요를 참조하세요.

시각적 가림막 vs 진정한 편집

왜 이런 일이 반복될까요? 핵심 기술적 격차에 답이 있습니다. 시각적 가림막과 진정한 삭제의 차이입니다.

시각적 가림막은 단어 위에 요소를 배치합니다. 파일에서 단어를 제거하지 않습니다. 이 방법들은 모두 이 범주에 속합니다. 검은 강조 표시는 배경을 검게 설정합니다. 흰 배경의 흰 글자는 색상을 맞추도록 변경합니다. 텍스트 위에 그린 검은 사각형은 보기를 숨깁니다. PDF 주석 가림막은 위에 불투명 레이어를 추가합니다. 이미지 오버레이는 단어 위에 검은 이미지를 배치합니다.

모든 경우에 원본 단어는 파일에 남아 있습니다. 해당 영역을 복사하거나 오버레이를 제거하면 찾을 수 있습니다. 기술 지식을 가진 사람은 원시 파일을 스캔할 수도 있습니다.

진정한 편집은 파일에서 단어를 영구적으로 제거합니다. 내용이 숨겨지는 것이 아니라 사라집니다. 찾을 것이 없습니다.

전송하는 파일에 대한 핵심 질문: 누군가 이 파일을 확인하면 원본 단어를 찾을 수 있습니까? 시각적 가림막의 경우 답은 예입니다. 편집 용어의 정의는 용어집을 참조하세요.

Word 문서 문제

동일한 실패가 Microsoft Word에 존재합니다. Word 파일에서 검은 강조 표시나 불투명 상자를 사용한 "편집"은 원본 단어를 문서의 XML에 남겨둡니다.

이것이 중요한 이유는 Word가 법률 서신, 계약서, 인사 파일, 내부 검토의 주요 형식이기 때문입니다. 강조 표시를 사용한 그룹들은 역사 전반에 걸쳐 실제로 삭제된 적 없는 데이터를 포함한 기록을 전송해왔습니다.

법률팀의 71%가 AI 도구를 사용합니다 — 정보 저장 우려에도 불구하고(ACC 2025 설문조사). AI 도구가 문서 작업에 진입함에 따라 과거 편집 실패를 드러낼 위험이 커집니다. 파일을 읽는 AI는 실제로 삭제된 적 없는 "편집된" 섹션의 단어를 찾을 수 있습니다.

유명한 편집 실패 사례

엡스타인 파일이 이 실패의 첫 번째 주목받는 사례가 아닙니다.

**Anthony Pellicano 사건(2007년)**은 연방 법원에 제출된 서류의 부적절한 편집을 통해 민감한 데이터가 공개된 사례입니다.

FOIA 요청을 통해 공개된 NSA 문서들은 검은 상자 아래 읽을 수 있는 단어들이 반복적으로 나타났습니다. 보안 연구자들이 국가 안보 공개에서 이를 문서화했습니다.

기업 소송 서류는 당사자들이 진정한 삭제 대신 PDF 주석 레이어를 사용할 때 종종 읽을 수 있는 내용을 포함합니다.

이 패턴은 기본적인 격차를 보여줍니다. 법률팀은 편집을 시각적 행위로 생각합니다. 하지만 PDF와 Word 형식은 화면에 보이는 것과 무관하게 구조화된 데이터를 포함합니다.

진정한 편집에 필요한 것

파일이 진정으로 편집되려면 단어가 제거되고 교체되어야 합니다. 기술 지식을 가진 사람이 복구할 수 없어야 합니다.

PDF 파일의 경우, 진정한 편집은 네 가지를 의미합니다. 첫째, PDF를 평탄화하여 모든 편집 가능한 레이어를 제거합니다. 둘째, 콘텐츠 스트림 수준에서 내용을 검은 상자로 교체합니다. 셋째, 원본 단어를 포함할 수 있는 메타데이터를 제거합니다. 넷째, 복구를 가능하게 할 수 있는 임베디드 폰트를 제거합니다.

Word 파일의 경우, 진정한 편집은 세 가지를 의미합니다. 첫째, 추적 변경, 댓글, 메타데이터, 수정 기록에서 대상 내용의 모든 인스턴스를 찾습니다. 둘째, 시각적으로 가리는 것이 아니라 내용을 교체합니다. 셋째, 표시를 남기지 않고 형식을 보존합니다.

핵심 단어는 교체입니다. 원본 내용을 무언가로 숨기는 것이 아니라 다른 것으로 교체해야 합니다.

머리글, 바닥글, 숨겨진 영역

법률 문서 편집에는 주요 본문 이상의 레이어가 있습니다. 민감한 데이터는 종종 시각적 도구가 완전히 놓치는 영역에 나타납니다.

머리글과 바닥글에는 종종 사건 이름, 고객 ID, 문서 번호가 포함됩니다. 계약 본문을 검게 칠하면서 머리글에 "특권 — 관련: TechCorp"를 남기면 목적이 사라집니다.

댓글과 추적 변경은 의도치 않은 공개의 일반적인 원천입니다. "John Smith의 메모 참조"라고 댓글을 단 검토자는 그 내용을 파일에 남깁니다. 절이 가려진 후에도 남습니다.

문서 속성과 메타데이터에는 작성자 이름과 수정 기록이 포함됩니다. 본문이 검게 칠해진 경우에도 문서 출처를 밝힐 수 있습니다.

Word의 수정 기록은 편집된 내용의 이전 버전을 보존합니다. 한때 "원고의 집 주소는 123 Main Street입니다"라고 했던 파일은 그 버전을 유지합니다. 지우지 않으면 남습니다.

준수 프로세스 구축

이러한 실패 모드를 고려하면 적절한 편집 프로세스에는 네 단계가 필요합니다.

1. Word 파일에는 네이티브 Word 통합을 사용하세요. Word 객체 모델 내에서의 편집은 파일에서 직접 내용을 교체합니다. 이것은 은폐 문제를 방지합니다. 먼저 PDF로 변환하면 위험이 추가되고 댓글과 수정 기록을 놓칠 수 있습니다.

2. 모든 문서 영역을 처리하세요. 준수 프로세스는 머리글, 바닥글, 각주, 미주, 댓글, 추적 변경, 문서 속성을 처리해야 합니다 — 주요 본문만이 아닙니다.

3. 출력물을 검증하세요. 편집 후 내용 복구를 시도하세요. 편집된 영역을 복사-붙여넣기 합니다. 문서의 XML을 확인합니다. 추적 변경과 수정 기록을 검토합니다. 어디서든 원본 내용이 나타나면 편집이 불완전합니다.

4. 감사 추적을 유지하세요. 법률 제출의 경우 무엇이 편집되었는지, 어떤 방법으로, 누구에 의해 편집되었는지 기록하세요. 특권 분쟁이 발생할 경우 중요합니다. 보안 및 준수 페이지에서 더 알아보세요.

엡스타인 파일의 교훈

엡스타인 파일 실패는 공개적인 교훈이었습니다. 시각적 가림막이 진정한 편집과 혼동될 때 무슨 일이 일어나는지 보여주었습니다.

이 이야기를 지켜본 모든 법률팀과 컴플라이언스 전문가는 두 가지 질문을 해야 합니다. 첫째, 우리의 과거 문서 제출에는 유사하게 복구될 수 있는 것이 있습니까? 둘째, 우리의 현재 프로세스가 실제로 내용을 삭제합니까, 아니면 단순히 가립니까?

답이 실제 노출을 결정합니다 — 편집 정책의 존재 여부가 아닙니다.


anonym.legal의 Office 추가 기능은 Word 파일 내에서 진정한 PII 교체를 수행합니다. 내용을 시각적으로 가리는 것이 아니라 문서 구조에서 직접 교체합니다. 머리글, 바닥글, 각주, 댓글, 추적 변경이 모두 처리됩니다. 결과는 원본 데이터가 숨겨진 것이 아니라 없는 파일입니다. 더 알아보기.

출처

데이터 보호를 시작할 준비가 되셨나요?

48개 언어로 285개 이상의 엔티티 유형으로 PII 익명화를 시작하세요.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.