By · Last updated 2026-06-03

ブログに戻るリーガルテック

法的PII: 弁護士・依頼人特権と匿名化

法律事務所におけるPII匿名化と、弁護士・依頼人特権(attorney-client privilege)の保護の両立。

June 3, 20267 分で読めます
attorney-client privilegelegal document reviewcase numberslaw firm privacylegal tech

title: "法律PII:特権検出" description: "事件番号、弁護士資格番号、裁判所の整理番号、依頼人案件IDは、標準的なPIIツールが見逃す法的に機密性の高い識別子です。" category: legal-tech publishedAt: 2026-06-03 tags:

  • 弁護士依頼人特権
  • 法的文書レビュー
  • 事件番号
  • 法律事務所プライバシー
  • リーガルテック readingTime: 7

AI時代の弁護士依頼人特権:匿名化ツールが検出すべき法律PII

標準的なPIIツールは名前、メール、社会保障番号を検出します。しかし、事件参照ID、弁護士資格番号、依頼人案件タグは見逃します。これらは深刻な特権リスクをもたらします。汎用ツールではその穴が残ります。

法律事務所は毎日AIツールにファイルを送っています。それらのファイルには、標準ツールが検出しない特権に敏感なマーカーが含まれています。

法律事務所がAIアシスタントを通じてファイルを処理する際、それらのファイルには標準PIIと並んで法的IDが含まれています:

  • 依頼人案件タグ: 案件ファイル全体にリンクし、依頼人を特定します
  • 事件参照ID: 裁判所が割り当てたコードで、プライベートな詳細を含む公開記録にリンクします
  • 弁護士資格番号: 州の公開ディレクトリで検索可能な弁護士IDです
  • 裁判所整理番号コード: 完全な事件履歴を持つ公開提出システムに接続します
  • 裁判官割り当てコード: 機密性の高い状況で担当裁判官を特定します

これらのいずれかが外部AIベンダーに送信されると、潜在的な特権問題が生じます。

なぜこれらのIDにカスタム検出が必要か

裁判所の整理番号形式は地区レベルのパターンに従います。すべての連邦裁判所と州裁判所をカバーする単一のパターンは存在しません。

連邦民事事件は2桁の年号、「cv」、事件番号を使用します。刑事事件は同じ場所に「cr」を使用します。州裁判所は共通の標準なしに地域によって異なります。

弁護士資格番号は州固有です。全国標準は存在しません。

依頼人案件タグは事務所固有です。各事務所が独自の形式を作ります。年-依頼人-案件。業務グループコード。連番ID。

標準PIIツールはカスタム設定なしにこれらを知ることができません。

このギャップは現実です。文書ツールは案件の全コンテキストを受け取ります。整理番号コードは公開記録にリンクします。依頼人タグが存在します。ツールはPIIが削除されたと報告します。名前とメールは削除されました。しかし特権に敏感なIDは削除されていません。

リーガルAIスタートアップの事例

あるリーガルAIスタートアップが法律事務所向けに文書ツールを構築しています。製品はdiscoveryファイルをスキャンし、関連条項を特定し、特権が設定されている可能性のあるコンテンツをフラグします。企業クライアントは処理前に標準PIIとともに依頼人案件タグの編集を要求します。

コンプライアンスの障壁:AIツールは依頼人案件タグを含むファイルメタデータを処理します。公開裁判所提出物と組み合わせると、それらのタグが案件の特定を可能にする可能性があります。企業のリーガルオペレーションチームはこれを受け入れられないと判断します。

カスタムエンティティ検出前:

  • 取引レビューでコンプライアンスのギャップを発見
  • カスタムNLPモデル開発のエンジニアリングキュー:3か月以上
  • 企業契約が保留

カスタムエンティティAPIを使用した場合:

  • コンプライアンス担当者がオンボーディング時に案件タグ形式を定義
  • サンプルファイルに対してパターンをテスト:2日
  • パイプラインにカスタムエンティティを追加:さらに1日
  • 企業契約が進行

差は3日対3か月以上です。作業はパターン設定とAPI統合です。NLPモデルのトレーニングは不要です。

カテゴリ別の一般的な形式

連邦裁判所の整理番号:

連邦民事事件の使用形式:2桁の年号 + 「cv」 + 4〜6桁の事件番号。例:24-cv-12345。刑事事件は同じ場所に「cr」を使用します。破産事件は「bk」を使用します。控訴は巡回区によって異なる2桁の年号と4〜5桁の番号を使用します。

州裁判所の形式(例):

カリフォルニア州上位裁判所は6桁のプレフィックスシステムを使用します。ニューヨーク州は年と連番のインデックス形式を使用します。テキサス州は年、連番、裁判所コードを含む事因形式を使用します。

依頼人案件タグ(典型的な事務所形式):

ほとんどの事務所で3つの一般的なパターンが見られます:

  • 2桁の年号、依頼人ID、案件連番(例:24-ACME-001)
  • 業務グループの頭文字、年号、4桁の連番(例:LIT240042)
  • 依頼人プレフィックスと6桁のID(例:SMITHCO-000123)

米国弁護士資格ID:

ほとんどの州は4〜8桁の数字を使用し、時に州レベルのプレフィックスを付けます。USDC入会IDは地区によって異なります。

特権を考慮した処理パイプライン

文書レビューAIには、全範囲を処理する多層パイプラインが必要です。

レイヤー1 — 標準PII検出

名前、メール、電話番号、住所、社会保障番号。高精度。確立されたツール。

レイヤー2 — カスタムコード検出

案件タグ、整理番号ID、弁護士ID。オンボーディング時に設定された事務所固有のパターン。このレイヤーがギャップを埋めます。

レイヤー3 — 特権レビュー(人間)

自動検出後、弁護士がフラグされたマーカーをレビューします。ATTORNEY-CLIENTヘッダー。WORK PRODUCTラベル。CONFIDENTIALマーキング。このレイヤーでの人間によるレビューは省略できません。

レイヤー4 — コンテキスト例外レビュー

特権リスクのない公開記録の整理番号対リスクのある依頼人案件タグ。これには弁護士の判断が必要です。自動化できません。

レイヤー1と2は大量の機械的作業を処理します。レイヤー3と4は、特権の決定が属する場所に弁護士の判断を維持します。AIツールの使用によって特権がすでに放棄された場合に何が起こるかについては、弁護士依頼人特権とAIを参照してください。

開発者向けセットアップ

オンボーディング設定

企業オンボーディング時に依頼人案件タグ形式を収集します。各事務所は異なる形式を使用します。事務所固有のカスタムエンティティとして保存します。そのアカウントのすべての処理に適用します。

デフォルトプリセット

プリビルトのプリセットはカスタム作業なしで一般的なコンテキストをカバーします:

  • 「連邦裁判所文書」— 民事、刑事、破産事件の連邦整理番号パターン
  • 「州裁判所文書(CA/NY/TX)」— 3つの主要な管轄の州固有の形式
  • 「内部業務」— 案件タグと標準PII
  • 「外部顧問ポータル」— 請求書参照、案件タグ、標準PII

監査文書

処理記録は各検出パスにカスタムコードが含まれていたことを示す必要があります。これは分析方法論のワークプロダクト保護をサポートします。

訴訟における編集コストのスケーリングについては、eディスカバリーPII自動化と法的レビューコスト削減を参照してください。

まとめ

特権に敏感なIDは標準PIIと同様にリスクを伴います—しばしばより深刻です。整理番号コードと案件タグを見逃すツールは、文書ワークフローに実際のギャップを残します。

解決策はNLPモデルではありません。パターン設定です。法律事務所向けのツールを構築する開発者にとって、それは3日間の修正と3か月のプロジェクトの違いです。法律事務所にとって、それは防御可能なAI支援レビューと特権放棄リスクの違いです。

出典

データを保護する準備はできましたか?

48言語で285以上のエンティティタイプを使用してPIIを匿名化し始めましょう。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.