2026年版に更新済み
一つの解決策が生む二つの新たなリスク
多くの企業は、AIプロバイダーにテキストが届く前に名前とIDを取り除くことで、AIからのデータ漏洩を防いでいます。一方向ハッシュ化、厳格な黒塗り、完全な削除はいずれも安全に見えます。AIはクリーンなテキストを受け取ります。機密情報は社内に留まります。
セキュリティの観点では、この論理は成立します。Cyberhavens Q4 2025調査では、ChatGPTに送信されたコンテンツの34.8%に機密データが含まれていることが判明しました。Ponemon 2024レポートは、AIデータ侵害の平均コストを210万ドルと試算しています。リスクは現実であり、コストも高いです。
しかし、完全な削除は一つのリスクを別のリスクと交換します:**証拠の毀損(スポリエーション)**です。
訴訟や監査の対象となる企業にとって、生データを復元する能力を破壊することは、連邦および州の規則の下でスポリエーションに相当する可能性があります。
AIデータ共有の規模
eSecurity PlanetとCyberhavens研究では、スタッフの77%が毎週AIツールと機密データを共有していることが判明しました。これは法律、医療、金融、テクノロジーにわたります。
共有されるコンテンツには多くの場合、以下が含まれます:
- クライアントへの書簡とケースノート
- 契約草案と取引条件
- 内部計画と事業記録
- 財務モデルと予測
- 法律メモとケースノート
- 患者記録と臨床メモ
- 人事ファイルとスタッフへの連絡
完全な削除がAIコントロールである場合、そこを通過するすべてのドキュメントが法的価値を失う可能性があります。それらのドキュメントが訴訟で浮上した場合(規制を受ける分野の企業にとって、複数年にわたる期間では非常に可能性が高い)、企業は証拠を失った可能性があります。
anonym.legalがどのように開示義務を満たしているかについては、法的準拠の概要をご覧ください。技術的なプロセスはトークンシステムガイドで説明しています。
GDPR:可逆性は必須
GDPR第4条(5)は、仮名化を、「当該追加情報が別に保管され、当該個人データが特定の又は特定可能な自然人に帰属しないことを確保するための技術的及び組織的措置が講じられている場合に、追加情報を使用しなければ特定の又は特定可能な自然人に帰属することができないように処理される個人データ」として定義しています。
重要なポイント:再帰属を可能にするキーは保持されなければなりません。保存されたキーを介して再リンクできる記録は、GDPRの下で仮名化されたとみなされます。
まったく再リンクできない記録は仮名化されていません。それらは匿名化されています。この差は重要です:
- トークンマスクされた記録はいくつかのGDPR義務を保持しますが、法的使用のために復元できます。
- 完全に消去された記録はGDPRの範囲外になる可能性がありますが、まったく復元できません。
欧州データ保護委員会のガイドライン05/2022は、可逆性が定義の核心部分であることを確認しています。一方向の削除を使用する企業はGDPRの仮名化を実施していません。記録を回復する能力を切り捨てているのです。
連邦規則:スポリエーションテスト
民事訴訟の連邦規則の下、当事者は予想される法的措置に関連する可能性のある記録を保存しなければなりません。この義務は訴訟が提起されたときではなく、合理的に予見可能になった時点で始まります。
規則37(e)は、当事者が保存された記録を保存しない場合、裁判所が制裁を課すことを認めています。制裁には以下が含まれます:
- 不利な推定指示
- 証拠の排除
- 深刻な事例での事件終結制裁
これがどのように展開されるかを説明します。企業は通常の業務において機密コンテンツを完全に削除するAIワークフローを使用しています。それらの記録が後に訴訟に関連することになります。企業はそれらを生のテキストが復元できないように変更しました。これが保存義務が生じた後に発生した場合、スポリエーションの露出が続きます。
これは少数事例ではありません。法的リスクが繰り返し生じる規制分野の企業は、広範な文書タイプにわたって常に予見可能な訴訟に直面しています。リスクのある記録の除外なしに、すべてのワークフローに完全な削除を展開することは、大きなスポリエーションリスクを生みます。
可逆的vs一方向:主要な違い
可逆的マスキングと一方向マスキングの違いは設計にあります。
一方向:戻る方法なし
名前のSHA-256ハッシュは固定ハッシュを生成します。ハッシュから名前を導出することはできません。厳格な黒塗りはテキストを削除するため、生のコンテンツは消えます。
可逆的:回復が可能
キー保持によるトークン置換とAES-256-GCM暗号化は、どちらも元に戻せる方法で記録を変換します。トークンに置き換えられた名前はルックアップテーブルを介して復元できます。AES-256-GCMコンテンツは正しいキーで復号化できます。生のテキストは到達可能なままです。
AIの保護のために、両方の方法は同じように機能します。AIはトークンを処理し、実際の記録を見ることはありません。
法的義務のためには、可逆的なトークンマスキングのみが機能します。一方向の方法は回復を切り捨て、上記のスポリエーションリスクを生み出します。
トークンシステムがこれをどのように端から端まで処理するかをご確認ください。より詳しいコンテキストについては、用語集とFAQをご参照ください。
デュアル準拠設計
AIセキュリティと法的開示義務の両方を満たす設計は、可逆的なAES-256-GCMトークンマスキングを使用します:
- AIツールに到達する前に記録が処理されます。
- 機密項目(名前、ID、PHI、特権コンテンツ)が構造化トークンに交換されます。
- トークンマップはデータタイプに合ったアクセス制御を持つ別のストアに保管されます。
- AI処理はトークンコピーで実行されます。AIは実際の記録を見ることはありません。
- 結果は通常のビジネス利用のためにトークンマップを使用して復元されます。
- 開示義務が生じると、トークンマップは法的保留下に置かれます。
この設計では、生のコンテンツが失われることはありません。AIプロバイダーは使用可能な形でそれを見ることはありません。トークンマップは法律が要求する際に回復を可能にします。スポリエーションリスクはなくなります。記録は破壊されず、元に戻せる方法でマスクされるだけです。
GDPR第4条(5)は満たされています:キー(トークンマップ)は適切な技術的およびプロセス上の保護措置とともに別に保管されます。連邦規則の保存義務は満たされています:法的保留が適用される際に生の記録を復元できます。
エンティティ検出アプローチ、保護の概要、プランと料金をご覧ください。
二択の選択
企業は明確な岐路に立たされています:
- データを永続的に削除する — AIの漏洩問題を解決するが法的リスクを生む。
- 可逆的なトークンマスキングを使用する — 保護と準拠の両方のニーズを同時に満たす。
210万ドルの平均AI侵害コストがセキュリティ決定を促します。しかし、スポリエーション制裁も安くはありません。高額の金銭的利害関係のある事例では、コストが同じオーダーの大きさに達する可能性があります。両方のリスクが検討に値します。
健全なAIポリシーは両方の側面をカバーします。機密記録が使用可能な形で企業を離れることをブロックします。そして、裁判所や規制当局が要求する際に同じ記録に到達可能な状態を保ちます。可逆的なトークンマスキングは、両方を同時に実現する唯一の方法です。