By · Last updated 2026-03-15

ブログに戻るリーガルテック

永続的な匿名化の罠:不可逆的な修正がスボリエーションリスクを生む理由

34.8%のChatGPT入力には機密データが含まれています(Cyberhaven)。解決策である永続的な匿名化は、独自の法的リスクであるスボリエーションを生み出します。GDPR第4条第5項および連邦規則第37条(e)は、可逆性を要求しています。

March 15, 202610 分で読めます
reversible encryptionspoliation risklegal discovery complianceGDPR pseudonymizationAES-256-GCM

2026年版に更新済み

一つの解決策が生む二つの新たなリスク

多くの企業は、AIプロバイダーにテキストが届く前に名前とIDを取り除くことで、AIからのデータ漏洩を防いでいます。一方向ハッシュ化、厳格な黒塗り、完全な削除はいずれも安全に見えます。AIはクリーンなテキストを受け取ります。機密情報は社内に留まります。

セキュリティの観点では、この論理は成立します。Cyberhavens Q4 2025調査では、ChatGPTに送信されたコンテンツの34.8%に機密データが含まれていることが判明しました。Ponemon 2024レポートは、AIデータ侵害の平均コストを210万ドルと試算しています。リスクは現実であり、コストも高いです。

しかし、完全な削除は一つのリスクを別のリスクと交換します:**証拠の毀損(スポリエーション)**です。

訴訟や監査の対象となる企業にとって、生データを復元する能力を破壊することは、連邦および州の規則の下でスポリエーションに相当する可能性があります。

AIデータ共有の規模

eSecurity PlanetとCyberhavens研究では、スタッフの77%が毎週AIツールと機密データを共有していることが判明しました。これは法律、医療、金融、テクノロジーにわたります。

共有されるコンテンツには多くの場合、以下が含まれます:

  • クライアントへの書簡とケースノート
  • 契約草案と取引条件
  • 内部計画と事業記録
  • 財務モデルと予測
  • 法律メモとケースノート
  • 患者記録と臨床メモ
  • 人事ファイルとスタッフへの連絡

完全な削除がAIコントロールである場合、そこを通過するすべてのドキュメントが法的価値を失う可能性があります。それらのドキュメントが訴訟で浮上した場合(規制を受ける分野の企業にとって、複数年にわたる期間では非常に可能性が高い)、企業は証拠を失った可能性があります。

anonym.legalがどのように開示義務を満たしているかについては、法的準拠の概要をご覧ください。技術的なプロセスはトークンシステムガイドで説明しています。

GDPR:可逆性は必須

GDPR第4条(5)は、仮名化を、「当該追加情報が別に保管され、当該個人データが特定の又は特定可能な自然人に帰属しないことを確保するための技術的及び組織的措置が講じられている場合に、追加情報を使用しなければ特定の又は特定可能な自然人に帰属することができないように処理される個人データ」として定義しています。

重要なポイント:再帰属を可能にするキーは保持されなければなりません。保存されたキーを介して再リンクできる記録は、GDPRの下で仮名化されたとみなされます。

まったく再リンクできない記録は仮名化されていません。それらは匿名化されています。この差は重要です:

  • トークンマスクされた記録はいくつかのGDPR義務を保持しますが、法的使用のために復元できます。
  • 完全に消去された記録はGDPRの範囲外になる可能性がありますが、まったく復元できません。

欧州データ保護委員会のガイドライン05/2022は、可逆性が定義の核心部分であることを確認しています。一方向の削除を使用する企業はGDPRの仮名化を実施していません。記録を回復する能力を切り捨てているのです。

準拠ハブ保護の概要で詳細をご確認ください。

連邦規則:スポリエーションテスト

民事訴訟の連邦規則の下、当事者は予想される法的措置に関連する可能性のある記録を保存しなければなりません。この義務は訴訟が提起されたときではなく、合理的に予見可能になった時点で始まります。

規則37(e)は、当事者が保存された記録を保存しない場合、裁判所が制裁を課すことを認めています。制裁には以下が含まれます:

  • 不利な推定指示
  • 証拠の排除
  • 深刻な事例での事件終結制裁

これがどのように展開されるかを説明します。企業は通常の業務において機密コンテンツを完全に削除するAIワークフローを使用しています。それらの記録が後に訴訟に関連することになります。企業はそれらを生のテキストが復元できないように変更しました。これが保存義務が生じた後に発生した場合、スポリエーションの露出が続きます。

これは少数事例ではありません。法的リスクが繰り返し生じる規制分野の企業は、広範な文書タイプにわたって常に予見可能な訴訟に直面しています。リスクのある記録の除外なしに、すべてのワークフローに完全な削除を展開することは、大きなスポリエーションリスクを生みます。

可逆的vs一方向:主要な違い

可逆的マスキングと一方向マスキングの違いは設計にあります。

一方向:戻る方法なし

名前のSHA-256ハッシュは固定ハッシュを生成します。ハッシュから名前を導出することはできません。厳格な黒塗りはテキストを削除するため、生のコンテンツは消えます。

可逆的:回復が可能

キー保持によるトークン置換とAES-256-GCM暗号化は、どちらも元に戻せる方法で記録を変換します。トークンに置き換えられた名前はルックアップテーブルを介して復元できます。AES-256-GCMコンテンツは正しいキーで復号化できます。生のテキストは到達可能なままです。

AIの保護のために、両方の方法は同じように機能します。AIはトークンを処理し、実際の記録を見ることはありません。

法的義務のためには、可逆的なトークンマスキングのみが機能します。一方向の方法は回復を切り捨て、上記のスポリエーションリスクを生み出します。

トークンシステムがこれをどのように端から端まで処理するかをご確認ください。より詳しいコンテキストについては、用語集FAQをご参照ください。

デュアル準拠設計

AIセキュリティと法的開示義務の両方を満たす設計は、可逆的なAES-256-GCMトークンマスキングを使用します:

  1. AIツールに到達する前に記録が処理されます。
  2. 機密項目(名前、ID、PHI、特権コンテンツ)が構造化トークンに交換されます。
  3. トークンマップはデータタイプに合ったアクセス制御を持つ別のストアに保管されます。
  4. AI処理はトークンコピーで実行されます。AIは実際の記録を見ることはありません。
  5. 結果は通常のビジネス利用のためにトークンマップを使用して復元されます。
  6. 開示義務が生じると、トークンマップは法的保留下に置かれます。

この設計では、生のコンテンツが失われることはありません。AIプロバイダーは使用可能な形でそれを見ることはありません。トークンマップは法律が要求する際に回復を可能にします。スポリエーションリスクはなくなります。記録は破壊されず、元に戻せる方法でマスクされるだけです。

GDPR第4条(5)は満たされています:キー(トークンマップ)は適切な技術的およびプロセス上の保護措置とともに別に保管されます。連邦規則の保存義務は満たされています:法的保留が適用される際に生の記録を復元できます。

エンティティ検出アプローチ保護の概要プランと料金をご覧ください。

二択の選択

企業は明確な岐路に立たされています:

  • データを永続的に削除する — AIの漏洩問題を解決するが法的リスクを生む。
  • 可逆的なトークンマスキングを使用する — 保護と準拠の両方のニーズを同時に満たす。

210万ドルの平均AI侵害コストがセキュリティ決定を促します。しかし、スポリエーション制裁も安くはありません。高額の金銭的利害関係のある事例では、コストが同じオーダーの大きさに達する可能性があります。両方のリスクが検討に値します。

健全なAIポリシーは両方の側面をカバーします。機密記録が使用可能な形で企業を離れることをブロックします。そして、裁判所や規制当局が要求する際に同じ記録に到達可能な状態を保ちます。可逆的なトークンマスキングは、両方を同時に実現する唯一の方法です。

詳細については創業者声明ケーススタディをご覧ください。

ソース

  • Cyberhaven Q4 2025:AIツールでのデータ露出 — リンク
  • IBM / Ponemon Institute:データ侵害コストレポート 2024 — リンク
  • EDPB仮名化に関するガイドライン05/2022 — リンク
  • 連邦民事訴訟規則第37条(e) — リンク
  • E-Discovery LLC:Relevance Redactions and Legal Standards — リンク

データを保護する準備はできましたか?

48言語で285以上のエンティティタイプを使用してPIIを匿名化し始めましょう。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.