ブログに戻るリーガルテック

法的赤削ツールにおけるフォーマットの問題 — ネイティブWord統合が唯一の解決策である理由

73%の法務専門家がサードパーティの赤削ツールを使用する際にフォーマットの破損を報告しています(Bloomberg Law 2024)。DOJのエプスタインファイルの赤削失敗は、PDFテキストレイヤーを通じてコンテンツを露出させました。ABAの正式意見498は、赤削確認を含む技術の適切な使用を要求...

April 8, 20268 分で読めます
legal document redactionWord formatting preservationlaw firm complianceABA redaction standardscourt document preparation

フォーマット破壊の問題

文書処理を行う法務専門家は、ほとんどの赤削ツールに構造的な問題を抱えています:これらのツールはPDFの赤削用に設計されており、ネイティブな文書処理ファイルには対応していません。これらのツールをWord文書に適用するには、変換ステップが必要です — WordからPDF、またはWordから中間フォーマットへの変換 — そして変換ステップはフォーマットを破壊します。

Bloomberg Lawの2024年の調査によると、73%の法務専門家がサードパーティの赤削ツールを使用する際にフォーマットの破損を報告しています。法的文書におけるフォーマットの破損は、単なる見た目の問題ではありません。裁判所への提出には特定のフォーマット要件があります — マージン、フォント、行間、ページ番号。専門家の証言報告書や調停提出書には、専門的な信頼性を示すフォーマットの慣習があります。雇用裁判所の声明は、オリジナル文書のフォーマットと一致しなければ、真正性を確立できません。

変換ベースの赤削ツールが段落スタイルを削除したり、表の構造を破壊したり、ヘッダー/フッターの内容を消去したりすると、結果として得られる文書は使用する前に手動で再構築する必要があります。匿名化に20分かかる文書の場合、手動でのフォーマット再構築には2〜4時間かかる可能性があり — 自動化による効率向上を消失させ、人為的エラーの二度目の機会を生み出します。

DOJエプスタインファイルのパターン

2025年1月、DOJがエプスタイン関連のファイルを公開した際、PDFテキストレイヤーの赤削が不適切に適用された文書が含まれていました — 視覚的な黒いボックスがレンダリングされたPDF内のテキストを覆っていましたが、基盤となるテキストレイヤーはアクセス可能で、赤削されたコンテンツはテキストを別のアプリケーションにコピーすることで抽出できました。

この失敗モードはフォーマットの破損とは異なりますが、同じカテゴリに属します:基盤となるデータを変更せずにプレゼンテーションレイヤーで動作する赤削ツールです。ブラックボックスPDF赤削は視覚的なレンダリングを変更しますが、テキストデータを削除しません。赤削を適用した専門家は正しく赤削された文書を見ましたが、テキストレイヤーを抽出した読者は未赤削のコンテンツを見ました。

ABAの正式意見498(2021年)は、電子コミュニケーションにおける能力について言及し、技術の適切な使用の要件を含んでおり、ABAは赤削確認を含めるように拡張しています。欠陥のある赤削で文書を提出する法務専門家は、ツールによって引き起こされたか、ユーザーの適用によるものであれ、専門的責任義務に違反した可能性があります。

ネイティブ統合の要件

フォーマットの破損に対する解決策は、変換ベースの処理ではなく、ネイティブ文書編集です。Microsoft Word内で動作する赤削ツール — ネイティブDOCXフォーマットを読み書きし、Wordオブジェクトモデルを使用してコンテンツを特定し変更する — は変換を必要とせず、したがって変換ステップによるフォーマット破壊を引き起こしません。

ネイティブWord統合は次のことを意味します:

スタイルの保持: 段落スタイル(見出し1、通常、本文)はファイル変換レベルではなく、文字レベルで修正されます。匿名化された名前は、オリジナルと同じ段落スタイル、フォントサイズ、フォーマットを保持します — ツールがWord文書のスタイルモデルで動作しているため、PDFレンダリングではありません。

表構造の保持: Wordの表は、セルの結合、カスタムボーダー、コンテンツタイプ特有のフォーマットを持つ複雑なオブジェクトです。ネイティブ編集は表の構造を保持します;変換ベースのツールはしばしばそれを平坦化または破壊します。

変更履歴とコメントの追跡: 修正中の法的文書には、追跡された変更(対立する弁護士の修正、パートナーの注釈)やコメント(クライアントの指示、相互参照)が含まれている場合があります。ネイティブ編集は、追跡された変更履歴を保持しながらコンテンツを処理できます;変換はこのメタデータを完全に破壊します。

ヘッダー、フッター、脚注の処理: 法的文書には、ヘッダー(クライアント名)、フッター(事件番号、機密通知)、脚注(事件引用、事実参照)にPIIが含まれていることがよくあります。ネイティブ編集はこれらの文書セクションに直接アクセスします;変換ベースのツールはそれらを完全に見逃す可能性があります。

ネイティブ統合の結果は、匿名化プロセスから出てきた文書がプロフェッショナルにフォーマットされ、元の文書と構造的に同一であること — 裁判所への提出、クライアントへの納品、または規制の提出のために手動で再構築することなく準備が整っていることです。

出典:

データを保護する準備はできましたか?

48言語で285以上のエンティティタイプを使用してPIIを匿名化し始めましょう。