39 миллионов учётных данных утекло за один год

Отчёт GitHub Octoverse 2024 выявил 39 миллионов секретов, утёкших на GitHub в 2024 году. Это рост на 25% год к году по сравнению с 2023-м. Секреты включают API-ключи, строки подключения к базам данных, токены авторизации и учётные данные облачных сервисов.

Причина известна. Разработчики коммитят код с секретами внутри. Секреты появляются в ходе отладочных сессий. Или жёстко прописываются в коде вместо хранения в переменных окружения. При 39 миллионах утечек это не редкость. Это рутина.

Инструменты ИИ добавляют второй канал утечки

Исследование GitGuardian 2025 года показало, что 67% разработчиков случайно раскрывали секреты в коде. Те же привычки, которые порождают утечки на GitHub, порождают утечки через инструменты ИИ.

Разработчик вставляет код в Claude, ChatGPT или другой ИИ-ассистент за помощью. Этот код нередко содержит действующие учётные данные. ИИ-модель получает секрет. Она может сохранить его в истории переписки. Отправляет на серверы провайдера. Разработчик теряет контроль — без каких-либо предупреждений.

Три примера:

Отладка базы данных. Разработчик вставляет трассировку стека. Трассировка содержит строку подключения. ИИ также считывает пароль.

Проверка конвейера. Разработчик делится скриптом конвейера данных. Скрипт содержит ключ доступа AWS и секретный ключ. ИИ получает оба.

Проверка API-интеграции. Разработчик запрашивает отзыв об интеграции. Код содержит действующий API-ключ партнёра. Ключ покидает сеть разработчика.

В каждом случае цель законна — получить помощь. Утечка учётных данных — побочный эффект предоставления ИИ достаточного контекста. Это тот же паттерн, что и утечки на GitHub: не злой умысел, просто рутина.

CI/CD-конвейеры сталкиваются с тем же риском

Утечки секретов в CI/CD-конвейерах выросли на 34% в 2024 году. Скрипты сборки, конфигурации развёртывания и файлы инфраструктуры как код теперь проходят через ИИ-проверку. Эти файлы нередко содержат облачные учётные данные и токены сервисных аккаунтов.

По мере того как инструменты ИИ охватывают всё больше этапов разработки — проверку, документацию, отладку, оптимизацию — поверхность воздействия растёт вместе с ними.

Как архитектура MCP блокирует утечки

Для команд, использующих Claude Desktop или Cursor IDE, архитектура MCP-сервера (Model Context Protocol) размещает фильтр учётных данных на пути между разработчиком и ИИ-моделью.

MCP-сервер обрабатывает каждый текст, проходящий через сессию. Вставленный код, трассировки стека, файлы конфигурации, отладочный контекст — всё проходит через этап анонимизации до того, как модель это увидит.

Движок находит паттерны учётных данных: форматы API-ключей, строки подключения к базам данных, токены OAuth, заголовки закрытых ключей и пользовательские форматы, определённые командой безопасности. Каждое совпадение заменяется токеном до передачи.

Как это выглядит на практике:

Разработчик вставляет трассировку стека со строкой подключения к базе данных. MCP-сервер заменяет строку на `[DB_CONNECTION_1]`. ИИ видит трассировку с токеном на месте строки. Даёт помощь в отладке на основе анонимизированной версии. Реальные учётные данные никогда не покидали внутреннюю сеть.

Это останавливает тот же вектор утечки, который наполняет GitHub секретами. Канал другой — инструменты ИИ, а не git-коммиты — но решение работает одинаково: блокировать до передачи.

Подробнее о том, как anonym.legal обеспечивает это в инструментах ИИ и рабочих процессах с документами, — в нашем обзоре безопасности и центре соответствия.

Обнаружение после факта — слишком поздно

Некоторые команды используют сканирование после коммита для выявления утёкших секретов. GitGuardian и truffleHog хорошо работают для канала GitHub. Но не охватывают сессии с инструментами ИИ.

Когда секрет достигает серверов провайдера ИИ — воздействие уже произошло. Сканирование обнаруживает его постфактум. Анонимизация на уровне MCP останавливает его до того, как оно достигнет модели.

39 миллионов утечек на GitHub документируют один канал. Воздействие через инструменты ИИ — та же проблема в канале с меньшим мониторингом и отсутствием журнала аудита. Предотвращение до передачи охватывает оба.

Источники

Связанные статьи

Безопасность ИИ

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.

Начать бесплатный пробный период Посмотреть функции

39 млн утечек на GitHub: риски ИИ-программирования

39 миллионов учётных данных утекло за один год

Инструменты ИИ добавляют второй канал утечки

CI/CD-конвейеры сталкиваются с тем же риском

Как архитектура MCP блокирует утечки

Обнаружение после факта — слишком поздно

Источники

Связанные статьи

Real-Time PII Prevention Saves $2.2M

GDPR Art. 32: AI Tools PII Monitoring

Real-Time PII Prevention for AI Data Leaks

Готовы защитить ваши данные?

39 млн утечек на GitHub: риски ИИ-программирования

39 миллионов учётных данных утекло за один год

Инструменты ИИ добавляют второй канал утечки

CI/CD-конвейеры сталкиваются с тем же риском

Как архитектура MCP блокирует утечки

Обнаружение после факта — слишком поздно

Источники

Связанные статьи

Real-Time PII Prevention Saves $2.2M

GDPR Art. 32: AI Tools PII Monitoring

Real-Time PII Prevention for AI Data Leaks

Готовы защитить ваши данные?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow