39 милиона изтекли идентификационни данни за една година

Докладът на GitHub Octoverse 2024 установи 39 милиона изтекли тайни в GitHub през 2024 г. Това е 25% ръст на годишна база спрямо 2023 г. Тайните включват API ключове, низове за бази данни, токени за удостоверяване и облачни идентификационни данни.

Причината е известна. Разработчиците записват код с тайни в него. Тайните идват от сесии за отстраняване на грешки. Или са твърдо кодирани вместо съхранени в променливи на средата. При 39 милиона изтичания, това не е рядкост. Това е рутина.

AI инструментите добавят втори канал за изтичане

Изследването на GitGuardian от 2025 г. установи, че 67% от разработчиците са случайно изложили тайни в код. Същите навици, които създават изтичания в GitHub, създават и изтичания в AI инструменти.

Разработчик поставя код в Claude, ChatGPT или друг AI асистент за помощ. Този код често съдържа живи идентификационни данни. AI моделът получава тайната. Може да я съхрани в историята на разговора. Изпраща я до сървърите на доставчика. Разработчикът губи контрол - без предупреждение.

Три примера:

Отстраняване на грешки в база данни. Разработчик поставя проследяване на стека. Проследяването включва низа за свързване. AI чете паролата също.

Преглед на тръбопровода. Разработчик споделя скрипт за тръбопровод за данни. Скриптът съдържа ключ за достъп до AWS и таен ключ. AI получава и двата.

Преглед на интеграция с API. Разработчик иска обратна връзка за интеграция. Кодът включва жив API ключ на партньор. Ключът напуска мрежата на разработчика.

Във всеки случай целта е законна помощ. Изтичането на идентификационни данни е страничен ефект от предоставянето на достатъчно контекст на AI. Това е същият модел като изтичанията в GitHub - не злонамерен, а просто рутинен.

CI/CD тръбопроводите са изправени пред същия риск

Изтичанията на тайни от CI/CD тръбопровод нарастнаха с 34% през 2024 г. Скриптовете за изграждане, конфигурациите за внедряване и файловете infrastructure-as-code вече минават през AI преглед. Тези файлове често съдържат облачни идентификационни данни и токени за служебни акаунти.

Тъй като AI инструментите обхващат все повече от цикъла на разработка - преглед, документация, отстраняване на грешки, оптимизация - повърхността на излагане нараства заедно с тях.

Как MCP архитектурата блокира изтичанията

За екипи, използващи Claude Desktop или Cursor IDE, архитектурата на MCP сървър (Model Context Protocol) поставя филтър за идентификационни данни по пътя между разработчика и AI модела.

MCP сървърът обработва всеки текст, преминаващ през сесията. Поставен код, проследявания на стека, конфигурационни файлове, контекст за отстраняване на грешки - всичко минава през стъпка за анонимизация преди моделът да го види.

Двигателят открива шаблони на идентификационни данни: формати на API ключове, низове за бази данни, OAuth токени, заглавки на частни ключове и персонализирани формати, определени от вашия екип по сигурността. Всяко съвпадение се заменя с токен преди предаването.

Как изглежда това на практика:

Разработчик поставя проследяване на стека с низ за свързване на база данни. MCP сървърът заменя низа с [DB_CONNECTION_1]. AI вижда проследяването с токена на негово място. Той дава помощ при отстраняване на грешки въз основа на анонимизираната версия. Действителните идентификационни данни никога не са напускали вътрешната мрежа.

Това спира същия вектор на изтичане, който запълва GitHub с тайни. Каналът е различен - AI инструменти, а не git записи - но поправката работи по същия начин: блокирай го преди да се предаде.

Вижте нашия преглед на сигурността за това как anonym.legal се справя с това при AI инструменти и работни процеси с документи, и центъра за съответствие за контроли на одитна пътека.

Засичането след факта е твърде късно

Някои екипи използват сканиране след записване, за да уловят изтеклите тайни. GitGuardian и truffleHog работят добре за канала на GitHub. Те не покриват сесиите с AI инструменти.

Когато тайна достигне сървърите на AI доставчик, излагането е свършен факт. Сканирането го открива след това. Анонимизацията на слоя MCP я спира да достигне модела изобщо.

39-те милиона изтичания в GitHub документират един канал. Излагането чрез AI инструменти е същият проблем в канал с по-малко наблюдение и без одитна пътека. Предотвратяването преди предаването покрива и двата.

Източници

Свързани статии

Сигурност на AI

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.

Започнете безплатен пробен период Вижте функции

39 млн. изтичания от GitHub: Риск от AI кодиране

39 милиона изтекли идентификационни данни за една година

AI инструментите добавят втори канал за изтичане

CI/CD тръбопроводите са изправени пред същия риск

Как MCP архитектурата блокира изтичанията

Засичането след факта е твърде късно

Източници

Свързани статии

AI Coding Assistants Leak Production PII

Internal Wiki PII: Confluence Customer Data

Screenshot PII: Leaks in Internal Tools

Готови ли сте да защитите данните си?

39 млн. изтичания от GitHub: Риск от AI кодиране

39 милиона изтекли идентификационни данни за една година

AI инструментите добавят втори канал за изтичане

CI/CD тръбопроводите са изправени пред същия риск

Как MCP архитектурата блокира изтичанията

Засичането след факта е твърде късно

Източници

Свързани статии

AI Coding Assistants Leak Production PII

Internal Wiki PII: Confluence Customer Data

Screenshot PII: Leaks in Internal Tools

Готови ли сте да защитите данните си?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow