By · Last updated 2026-03-05

ブログに戻るリーガルテック

エプスタインファイルの後: ブラックボックスハイライトは真の赤actionではない理由

2025年12月のDOJエプスタインファイルの公開は、重要な赤actionの失敗を暴露しました: 黒くハイライトされたPDFテキストはコピー&ペーストを通じて読み取ることができます。法律チームの71%がAIツールを使用している中、真の赤actionが何を意味するのかを理解することはこれまでになく緊...

March 5, 20267 分で読めます
document redactionPDF redaction failurelegal complianceWord redaction

2025年12月の墨消し失敗

2026年版に更新済み

米国司法省は2025年12月にエプスタイン関連文書を公開しました。報道はすぐに内容から墨消し処理へと焦点が移りました。特に、その墨消しがいかに容易に回避できるかが注目されました。

方法は単純でした。PDFファイルの「墨消し」されたコンテンツは、ハイライトで黒く塗られていました。しかし、元の文字はPDFのテキストレイヤーに残ったままです。その黒い領域をテキストエディタにコピーすると、元の文字が現れます。視覚的な隠蔽は真の削除ではありませんでした。機密データは一度も除去されていなかったのです。

これは新しい欠陥ではありませんでした。2007年のアンソニー・ペリカーノ事件では、法的文書での不適切な墨消しによって機密データが露出しました。同じ失敗は何年もの間、裁判所の書類や政府報告書に繰り返し現れていました。しかしエプスタイン関連文書は、この失敗をリアルタイムで何千万もの人々に見せることになりました。

法的文脈での文書の匿名化についての詳細は、コンプライアンス概要をご覧ください。

視覚的隠蔽と真の墨消し

なぜこのことが繰り返し起きるのでしょうか?答えは重要な技術的差異にあります。視覚的隠蔽と真の削除の間には違いがあります。

視覚的隠蔽は文字の上に要素を配置します。文字はファイルから除去されません。以下のすべての方法がこのカテゴリに入ります。黒いハイライトは背景を黒くします。白い背景に白い文字は色をページに合わせます。文字の上に描かれた黒い矩形はコンテンツを視覚的に隠します。PDF注釈による隠蔽は不透明なレイヤーを追加します。画像のオーバーレイは文字の上に黒い画像を配置します。

どの場合も、元の文字はファイルに残ります。領域をコピーするか隠蔽を除去すれば見つけられます。技術的なスキルを持つ人はファイルの生の構造を調べることもできます。

真の墨消しは文字をファイルから永久に除去します。コンテンツは隠されているのではなく、消えています。見つけるものは何も残っていません。

送信するファイルに関して重要な問いは一つです:誰かがこのファイルを調べたとき、元の文字を見つけることができるでしょうか?視覚的隠蔽では答えはYesです。墨消し用語の定義については用語集をご覧ください。

Wordドキュメントの問題

同じ失敗はMicrosoft Wordにも存在します。黒いハイライトや不透明なボックスを使ってWordファイルを「墨消し」すると、元の文字はドキュメントのXML構造に残ります。

これが重要なのは、Wordが法律文書、契約書、人事ファイル、内部審査の主要フォーマットだからです。ハイライトを使用してきた組織は、その歴史を通じて回収可能なデータを含む記録を送り続けていました。

法律チームの71%がAIツールを使用しています(ACC 2025年調査)。情報保管に関する懸念があるにもかかわらずです。AIツールが文書作業に入り込むにつれて、過去の墨消し失敗が発覚するリスクが高まります。ファイルを読むAIは、実際には削除されていない「墨消し」セクションの文字を見つけることがあります。

注目を集めた墨消し失敗事例

エプスタイン関連文書はこの失敗の初めての注目事例ではありませんでした。

**アンソニー・ペリカーノ事件(2007年)**では、連邦裁判所に提出された不適切に墨消しされた書類を通じて機密データが明らかになりました。[外部検証済み]

NSA文書はFOIA請求を通じて公開され、黒いボックスの下に繰り返し読める文字が含まれていました。セキュリティ研究者は国家安全保障文書の公開においてこれを記録しています。[外部検証済み]

企業の訴訟書類では、当事者が真の削除ではなくPDF注釈レイヤーを使用する場合に、読める内容が含まれていることがよくあります。[検証済み]

このパターンは基本的な差異を示しています。法律チームは墨消しを視覚的な行為と考えます。しかしPDFとWordの形式は、画面に表示されるものに関係なく構造化データを含んでいます。

真の墨消しに必要なこと

ファイルを真に墨消しするには、文字を除去して置き換える必要があります。技術的なスキルを持つ人が回収できない状態にしなければなりません。

PDFファイルでは、真の墨消しには4つのことが必要です。まず、すべての編集可能なレイヤーを除去するためにPDFをフラット化します。次に、コンテンツストリームレベルでコンテンツを黒いボックスに置き換えます。そして、元の文字を含む可能性のあるメタデータを除去します。最後に、回収を可能にする可能性のある埋め込みフォントを除去します。

Wordファイルでは、真の墨消しには3つのことが必要です。まず、ターゲットコンテンツのすべての箇所を見つけます——変更履歴、コメント、メタデータ、リビジョン履歴の中も含めて。次に、コンテンツを視覚的に覆うのではなく置き換えます。そして、痕跡を残さずにフォーマットを保持します。

キーワードは置き換えです。元のコンテンツは別のものに置き換えられなければならず、別のものの下に隠されるのではいけません。

ヘッダー、フッター、隠れたゾーン

法的文書の墨消しは本文だけではありません。機密データは視覚ツールが見落とすゾーンに現れることがよくあります。

ヘッダーとフッターには、案件名、クライアントID、文書番号が含まれていることがよくあります。ヘッダーに「秘密——TechCorp案件」を残したまま契約書の本文を黒くすることは、目的に反します。

コメントと変更履歴は意図しない開示の一般的な原因です。「ジョン・スミスのメモを参照」とコメントしたレビュアーは、そのコメントをファイルに残します。条項を隠した後も残り続けます。

ドキュメントのプロパティとメタデータには著者名とリビジョン履歴が含まれます。本文が黒くなっていても、これらがドキュメントの出所を明らかにする可能性があります。

リビジョン履歴はWordで編集されたコンテンツの以前のバージョンを保持します。かつて「原告の自宅住所は〇〇番地です」と書かれていて編集されたファイルは、そのバージョンを保持します。明示的にクリアしない限り残り続けます。

準拠したプロセスの構築

これらの失敗モードを踏まえると、適切な墨消しプロセスには4つのステップが必要です。

1. WordファイルにはネイティブのWord統合を使用する。 Wordのオブジェクトモデルでのリダクションはファイルのコンテンツを直接置き換えます。これにより隠蔽の問題を避けられます。まずPDFに変換することでリスクが増し、コメントやリビジョン履歴を見落とす可能性があります。

2. すべてのドキュメントゾーンを処理する。 準拠したプロセスは、本文だけでなく、ヘッダー、フッター、脚注、文末注、コメント、変更履歴、ドキュメントプロパティを処理しなければなりません。

3. 出力を検証する。 墨消し後、コンテンツの回収を試みてください。墨消しされた領域をコピー&ペーストしてください。ドキュメントのXMLを確認してください。変更履歴とリビジョン履歴を調べてください。元のコンテンツがどこかに現れたら、墨消しは不完全です。

4. 監査証跡を維持する。 法的プロダクションの場合、何が墨消しされたか、どの方法で、誰によって行われたかを記録してください。特権の争いが生じた場合に重要になります。詳細はセキュリティと適合性のページをご覧ください。

エプスタイン関連文書からの教訓

エプスタイン関連文書の失敗は公開された教訓でした。視覚的隠蔽が真の墨消しと混同されたときに何が起こるかを示しました。

この事例を見てきた法律チームとコンプライアンス専門家は、2つの質問をすべきです。まず、過去の文書プロダクションに同様に回収できるものがあるか。次に、現在のプロセスは実際にコンテンツを削除しているか、それとも単に隠しているだけか。

これらへの答えが本当のリスクを決定します——墨消しポリシーの存在だけではありません。


anonym.legalのOfficeアドインはWordファイル内で真のPII置換を実行します。コンテンツをドキュメント構造に直接置き換え、視覚的に上から覆うのではありません。ヘッダー、フッター、脚注、コメント、変更履歴はすべて処理されます。結果は元のデータが存在しないファイルであり、隠されているだけではありません。詳細はこちら

出典

データを保護する準備はできましたか?

48言語で285以上のエンティティタイプを使用してPIIを匿名化し始めましょう。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.