39 милиони ингеренции протекоа за една година
Извештајот GitHub Octoverse 2024 утврди 39 милиони тајни протекоа на GitHub во 2024 година. Тоа е зголемување за 25% на годишно ниво во споредба со 2023 година. Тајните вклучуваат API клучеви, стрингови на бази на податоци, токени за автентикација и облак ингеренции.
Причината е позната. Програмерите извршуваат commit на код со тајни внатре. Тајните доаѓаат од сесии за дебагирање. Или се хардкодирани наместо да се складираат во environment variables. При 39 милиони протекувања, ова не е реткост. Тоа е рутина.
AI алатките додаваат втор канал за протекување
Истражувањето на GitGuardian за 2025 година утврди дека 67% од програмерите случајно изложиле тајни во код. Истите навики кои создаваат протекувања на GitHub исто така создаваат протекувања преку AI алатки.
Програмер залепува код во Claude, ChatGPT или друг AI асистент за помош. Тој код често содржи живи ингеренции. AI моделот ја прима тајната. Може да ја зачува во историјата на разговорот. Ја испраќа до серверите на давателот. Програмерот ја губи контролата - без предупредување.
Три примери:
Дебагирање на база на податоци. Програмер залепува следење на стакот. Следењето го вклучува стрингот за поврзување. AI ја чита и лозинката.
Преглед на цевковод. Програмер споделува скрипта за цевковод на податоци. Скриптата има AWS клуч за пристап и тајни клуч. AI ги прима двата.
Преглед на API интеграција. Програмер бара повратни информации за интеграција. Кодот вклучува жив партнерски API клуч. Клучот ја напушта мрежата на програмерот.
Во секој случај, целта е легитимна помош. Протекувањето на ингеренцијата е несакана последица на давањето доволно контекст на AI. Ова е истиот образец како протекувањата на GitHub - не злонамерен, само рутински.
CI/CD цевководите се соочуваат со ист ризик
Протекувањата на тајни во CI/CD цевководите се зголемиле за 34% во 2024 година. Скриптите за изградба, конфигурациите за распоредување и датотеките за инфраструктура-како-код сега минуваат низ AI преглед. Овие датотеки често содржат облак ингеренции и токени за сметки на услуги.
Додека AI алатките покриваат се поголем дел од циклусот за развој - преглед, документација, дебагирање, оптимизација - просторот на изложеност расте заедно со нив.
Како архитектурата на MCP ги блокира протекувањата
За тимовите кои користат Claude Desktop или Cursor IDE, архитектурата на MCP сервер поставува филтер за ингеренции на патот помеѓу програмерот и AI моделот.
MCP серверот управува со секој текст кој се движи низ сесијата. Залепен код, следења на стакот, конфигурациски датотеки, контекст за дебагирање - сето тоа минува низ чекор на анонимизација пред моделот да го види.
Моторот наоѓа обрасци на ингеренции: формати на API клучеви, стрингови на бази на податоци, OAuth токени, заглавија на приватни клучеви и прилагодени формати кои ги дефинира вашиот безбедносен тим. Секое совпаѓање се заменува со токен пред пренос.
Како изгледа ова во пракса:
Програмер залепува следење на стакот со стринг за поврзување на база на податоци. MCP серверот го заменува стрингот со [DB_CONNECTION_1]. AI го гледа следењето со токенот на место. Дава помош за дебагирање врз основа на анонимизираната верзија. Вистинската ингеренција никогаш не ја напустила внатрешната мрежа.
Ова го запира истиот вектор на протекување кој ги полни GitHub со тајни. Каналот е различен - AI алатки, не git commit-и - но поправката функционира на ист начин: блокирај го пред да се пренесе.
Погледнете го нашиот преглед на безбедноста за тоа како anonym.legal го решава ова низ AI алатки и документациски работни текови, и центарот за усогласување за контроли на ревизорска трага.
Откривањето по факт е предоцна
Некои тимови користат скенирање по commit за да фатат протечени тајни. GitGuardian и truffleHog добро функционираат за каналот на GitHub. Тие не го покриваат сесиите на AI алатки.
Кога тајната ќе достигне до серверите на AI давателот, изложеноста е завршена. Скенирањето го наоѓа потоа. Анонимизацијата на слојот MCP ја спречува да достигне до моделот воопшто.
Протекувањата на 39 милиони на GitHub документираат еден канал. Изложеноста преку AI алатки е ист проблем во канал со помалку мониторинг и без ревизорска трага. Превенцијата пред пренос ги покрива двата.