By · Last updated 2026-06-05

ブログに戻るAIセキュリティ

リアルタイムPII予防: AIデータ漏洩

AIツール(ChatGPT等)へのデータ送信をリアルタイムで検出・ブロック。企業データの流出予防。

June 5, 20267 分で読めます
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

リアルタイムPII防止:AIデータ漏洩を起きる前に止める。

2026年版に更新済み。

2023年3月、サムスンのエンジニアがソースコードをChatGPTに貼り付けました。コードはすぐにサムスンの管理外に出ました。どのツールも間に合いませんでした。事後のセキュリティ管理はAIデータ漏洩を止められません。この出来事がそれを証明しました。

検知ツールは事後に何が起きたかを教えます。ログ確認、エンドポイントDLP、監査ログはすべてそのように機能します。AIの漏洩では、事後では遅すぎます。データはすでにAIモデルに到達しています。

問題の規模

2025年のサイバーヘイブン調査が企業のAI利用を分析しました。結果は驚くべきものでした。

  • ChatGPTのプロンプトの11%がプライベートまたは機密データを含んでいます。
  • 平均的な従業員は1日14回AIツールを使用します。
  • 高頻度ユーザーは1日30〜50回やり取りします。
  • 11%の割合では、1人あたり1日3〜5件の機密送信が発生します。

高頻度ユーザーが500人いる企業では、1日2,000件以上の機密送信が発生します。それぞれがGDPR第83条違反になる可能性があります。リスクは法的なものだけではありません。評判と信頼も危機にさらされます。

AIプロンプトに含まれる機密コンテンツの一般的な種類:

  • 顧客名と連絡先情報。
  • 口座番号と支払い記録。
  • 医療従事者の医療メモ。
  • 弁護士の案件詳細。
  • HRチームの従業員評価メモ。
  • 社内の財務・売上予測。

この調査では意図的な共有と偶発的な共有を区別していません。どちらも同じ法的リスクをもたらします。顧客名を削除し忘れた従業員は、意図的にルールを無視した従業員と同じ違反を引き起こします。意図は結果を変えません。

検知が不十分な理由

ネットワーク監視はTLSブロックなしにHTTPSトラフィックを読み取れません。TLSブロックはオーバーヘッドを増やしプライバシーの懸念を引き起こします。現代のブラウザはそれをよく拒否します。

エンドポイントDLPエージェントはクリップボードとキー入力を監視します。しかし遅延があります。エージェントがパターンを検知する頃には、プロンプトはすでに送信済みかもしれません。

ベンダーの監査ログは共有された後に何が共有されたかを記録します。インシデント対応に役立ちます。漏洩は止められません。

従業員トレーニングはポリシーであり管理手段ではありません。サイバーヘイブン調査は、明確なポリシーを持つ企業でもプロンプトの11%に機密コンテンツが含まれることを示しています。トレーニングは偶発的なミスを止めません。

AIツールのブロックは生産性を損ないます。従業員は個人のデバイスやアカウントを使用するようになります。それは活動をあらゆる監視の外に置きます。

これらの方法はいずれも機密コンテンツをリアルタイムで止めません。

入力時点での予防

唯一の確実な防御は送信前のマスキングです。ブラウザを離れる前に**[PERSON_1]**に置き換えられた顧客名は、AIモデルに決して見られません。

インラインマスキングの仕組みは以下の通りです。

  1. 従業員がClaudeまたはChatGPTに顧客メールを入力します。
  2. ブラウザ拡張機能がリアルタイムで個人データを検知します。
  3. エンティティにタイプラベルが付きます:PERSON、EMAIL_ADDRESS、ACCOUNT_NUMBER。
  4. 従業員はマークされた項目を確認します。
  5. ワンクリックですべてのエンティティをトークンに置き換えます。
  6. マスクされたプロンプトが送信されます。

AIはこのようなプロンプトを受け取ります:「顧客**[PERSON_1][EMAIL_1])が口座[ACCOUNT_1]**を持っています。」

AIは本物の名前や番号を見ずにリクエストを処理します。従業員は文脈から実際の顧客を把握します。

このアプローチには明確なメリットがあります。

  • 個人データは外部AIシステムの外に留まります。
  • 顧客データはAIのトレーニングセットに追加されません。
  • 従業員はAIツールへのアクセスを保持します。生産性は高く保たれます。

従業員がツールを迂回した場合の意図的な共有は止められません。添付ファイルは別のワークフローが必要です。完璧な管理手段はありません。しかしインラインマスキングは偶発的なグループを排除します。そのグループがほとんどのインシデントを占めます。結果は、日常のワークフローを変えずに大幅なリスク低減です。

法律事務所のケーススタディ

ある法律事務所のアソシエイトが契約メモの作成にClaudeを使用していました。方法:契約のセクションをコピーし、Claudeに貼り付け、要約を依頼。

Chrome拡張機能導入前 — 最初の6か月:

  • コンプライアンス審査中に3件の顧客データインシデントを発見。
  • 各インシデント:顧客名と案件番号がプロンプトに含まれていた。
  • 3件すべてが偶発的なものでした。

Chrome拡張機能導入後 — 次の6か月:

  • 顧客データインシデントはゼロ。
  • アソシエイトは顧客名を含むセクションを貼り付ける際にリアルタイム警告を受けました。
  • ワンクリックで「Johnson Controls案件2024-0347」が「[PERSON_1]案件[REFERENCE_1]」に置き換えられました。
  • 方法は変わりませんでした。

マネージングパートナーはこう述べました:「アソシエイトは拡張機能の前からポリシーを知っていました。拡張機能がコンプライアンスを最も簡単な道にしました。」

他の企業がどのように対処したかはケーススタディでご覧ください。セキュリティ概要で管理手段を確認してください。

コンプライアンスチームのためのGDPR文書化

ブラウザベースのAIマスキングを使用する企業は、それを技術的管理手段として文書化する必要があります。

処理活動の記録(RoPA): AIプロンプトがベンダーに到達する前にクライアント側でマスキングされることを記載します。検知されたエンティティタイプ、エンジンバージョン、デプロイログを証拠として一覧化します。

データ処理者契約: AIベンダーに個人データが到達しない場合、DPAの義務が簡略化されます。管理するデータはシステムの外に出ません。

監査ログ: 拡張機能のログがセッションごとのエンティティ数、マスキング率、ボリュームによるエンティティタイプを記録します。これらの指標はコンプライアンス報告に直結します。

AIツールのGDPR要件は法的コンプライアンスガイド用語集でご確認ください。よくある質問はFAQにあります。

まとめ

サムスン事件は、AIの漏洩が事後の管理手段が反応するより速く起きることを示しました。サイバーヘイブン調査はそれを数値化しました:プロンプトの11%、毎日、従業員一人当たり何度も。

送信前のリアルタイムマスキングは根本原因を解決します。個人データがAIモデルに到達しなければ、検知、記録、クリーンアップするものは何もありません。従業員はAIツールを使い続けます。企業はコンプライアンス状況を維持します。

検知は予防が失敗した時に教えます。AIデータ漏洩では、失敗のコスト — 罰金、評判への損害、信頼の喪失 — が予防を最初の選択肢とすることを正当化します。

あなたの企業の料金をご確認ください。予防を中心設計原則とした理由について創業者声明をお読みください。

ソース

  • サイバーヘイブン:AI Data Exposure Study 2025 — cyberhaven.com。
  • サムスン-ChatGPTデータ漏洩、2023年3月 — Bloomberg。
  • GDPR第4条および第32条:個人データと技術的措置 — gdpr-info.eu。

データを保護する準備はできましたか?

48言語で285以上のエンティティタイプを使用してPIIを匿名化し始めましょう。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.