1年間で3,900万件の認証情報が漏洩
GitHubのOctoverse 2024レポートは、2024年にGitHub上で3,900万件のシークレットが漏洩したことを記録しました。これは2023年と比べて前年比25%の増加です。シークレットにはAPIキー、接続文字列、認証トークン、クラウド認証情報が含まれます。
原因は明らかです。開発者はシークレットを含んだコードをコミットしています。シークレットはデバッグセッションから来ることもあります。あるいは環境変数ではなくハードコードされています。3,900万件の漏洩があれば、これは例外ではありません。日常的な出来事です。
AIツールが第二の漏洩チャネルを生み出す
GitGuardianの2025年の調査によると、開発者の67%がコード内でシークレットを誤って公開した経験があります。GitHubの漏洩を引き起こす同じ習慣が、AIツールの漏洩も引き起こします。
開発者がClaudeやChatGPT、その他のAIアシスタントにコードを貼り付けて助けを求めます。そのコードには多くの場合、有効な認証情報が含まれています。AIモデルはシークレットを受け取ります。会話履歴に保存されることもあります。プロバイダーのサーバーに送信されます。開発者は警告なしにコントロールを失います。
3つの例を示します:
データベースのデバッグ。 開発者がスタックトレースを貼り付けます。トレースには接続文字列が含まれています。AIモデルはパスワードも読み取ります。
パイプラインレビュー。 開発者がデータパイプラインのスクリプトを共有します。スクリプトにはAWSアクセスキーとシークレットキーが含まれています。AIモデルは両方を受け取ります。
API統合レビュー。 開発者が統合に関するフィードバックを求めます。コードには有効なパートナーAPIキーが含まれています。キーは開発者のネットワーク外に出ます。
いずれのケースも目的は正当なものです。認証情報の漏洩は、モデルに十分なコンテキストを与えることの副作用です。これはGitHubの漏洩と同じパターンです。悪意はなく、単なる日常業務の結果です。
CI/CDパイプラインも同様に露出している
CI/CDパイプラインにおけるシークレット漏洩は2024年に34%増加しました。ビルドスクリプト、デプロイ設定、Infrastructure as Codeファイルも今ではAIレビューを通過します。これらのファイルにはクラウド認証情報やサービスアカウントトークンが含まれることが多いです。
AIツールが開発サイクルの広い範囲をカバーするようになると——レビュー、ドキュメント、デバッグ、最適化——露出面も同様に拡大します。
MCPアーキテクチャが漏洩を阻止する
Claude DesktopまたはCursor IDEを使用するチームでは、Model Context Protocol(MCP)サーバーアーキテクチャが開発者とAIモデルの間に認証情報フィルターを配置します。
MCPサーバーはセッションを流れるすべてのテキストを処理します。貼り付けたコード、スタックトレース、設定ファイル、デバッグコンテキスト——モデルが見る前にすべてが匿名化ステップを通過します。
エンジンは認証情報のパターンを検出します:APIキーの形式、接続文字列、OAuthトークン、秘密鍵のヘッダー、セキュリティチームが定義するカスタム形式。各一致は送信前にトークンに置き換えられます。
実際にどのように機能するか:
開発者がデータベース接続文字列を含むスタックトレースを貼り付けます。MCPサーバーはその文字列を[DB_CONNECTION_1]に置き換えます。AIモデルはトークンが入ったトレースを見ます。匿名化されたバージョンに基づいてデバッグの助けを提供します。実際の認証情報は社内ネットワークを離れませんでした。
これはGitHubをシークレットで満たす同じ漏洩ベクターを止めます。チャネルは異なります——gitコミットではなくAIツール——しかし解決策は同じように機能します:送信前にブロックします。
セキュリティ概要ではanonym.legalがAIツールとドキュメントワークフローにこれをどう適用するかを説明しています。コンプライアンスセンターでは監査コントロールについて詳しく説明しています。
事後検知では遅すぎる
一部のチームはコミット後のスキャンで漏洩したシークレットを検出しようとします。GitGuardianやtruffleHogはGitHubチャネルに対して効果的です。AIツールセッションはカバーしていません。
シークレットがAIプロバイダーのサーバーに到達した時点で、露出は既に発生しています。スキャンはその後に発見します。MCPレイヤーの匿名化は、そもそもモデルに到達することを防ぎます。
GitHubの3,900万件の漏洩は一つのチャネルを記録しています。AIツールによる露出は、監視が少なく監査証跡のないチャネルにおける同じ問題です。送信前の防止策は両方をカバーします。