39 miljonit mandaati lekitati ühe aastaga
GitHubi Octoverse 2024 aruanne leidis, et 2024. aastal lekitati GitHubis 39 miljonit saladust. See on 25% aastane kasv 2023. aastast. Saladuste hulka kuuluvad API-võtmed, andmebaasi ühendusstring, autentimisleksemid ja pilvekredensiaalid.
Põhjus on teada. Arendajad kommitatavad koodi, milles on saladused. Saladused pärinevad silumisseanssidest. Või need hardkodeeritakse keskkonna muutujate asemel. 39 miljoni leke puhul ei ole see harv. See on rutiinne.
Tehisintellekti tööriistad lisavad teise lekkekanali
GitGuardiani 2025 uuring leidis, et 67% arendajatest on kogemata koodi kaudu saladusi paljastanud. Samad harjumused, mis tekitavad GitHubi lekked, tekitavad ka tehisintellekti tööriistade lekked.
Arendaja kleebib koodi Claude'i, ChatGPT-sse või mõnda muusse tehisintellekti assistenti abi saamiseks. Sellel koodil on sageli sees elusad kredensiaalid. Tehisintellekti mudel saab saladuse. See võib salvestada selle vestlusajalukku. See saadab selle teenusepakkuja serveritesse. Arendaja kaotab kontrolli – ilma hoiatuseta.
Kolm näidet:
Andmebaasi silumine. Arendaja kleebib virna jälje. Jälg sisaldab ühendusstring. Tehisintellekt loeb ka parooli.
Torustiku ülevaade. Arendaja jagab andmete torustiku skripti. Skriptis on AWS-i juurdepääsuvõti ja salajane võti. Tehisintellekt saab mõlemad.
API integratsiooni ülevaade. Arendaja palub tagasisidet integratsiooni kohta. Kood sisaldab elusa partneri API-võtit. Võti lahkub arendaja võrgust.
Igal juhul on eesmärk õigustatud abi. Mandaatide leke on kõrvalefekt, mis tuleneb tehisintellektile piisava konteksti andmisest. See on sama muster kui GitHubi lekked – mitte pahatahtlik, lihtsalt rutiinne.
CI/CD torustikud seisavad silmitsi sama riskiga
CI/CD torustiku saladuste lekked kasvasid 2024. aastal 34%. Ehitusskripte, juurutuse konfiguratsioone ja infrastruktuuri-kui-koodi faile vaadatakse nüüd tehisintellektiga üle. Need failid sisaldavad sageli pilvekredensiaalid ja teenusekonto leksemid.
Kuna tehisintellekti tööriistad katavad üha rohkem arendusetsüklit – ülevaade, dokumentatsioon, silumine, optimeerimine – kasvab kokkupuute pind koos nendega.
Kuidas MCP-arhitektuur lekked blokeerib
Claude Desktopi või Cursor IDE-d kasutavatele meeskondadele paneb Model Context Protocol (MCP) serveri arhitektuur mandaatide filtri arendaja ja tehisintellekti mudeli vahele.
MCP-server käsitleb kogu teksti, mis liigub läbi seansi. Kleebitud kood, virna jäljed, konfiguratsioonifailid, silumise kontekst – kõik see läbib anonümiseerimise etapi enne mudeli nägemist.
Mootor leiab mandaatide mustrid: API-võtme vormingud, andmebaasi stringid, OAuth leksemid, privaatvõtme päised ja kohandatud vormingud, mille teie turbetiim määratleb. Iga vaste asendatakse leksemiga enne edastamist.
Mis see praktikas välja näeb:
Arendaja kleebib virna jälje andmebaasi ühendusstring. MCP-server asendab stringi [DB_CONNECTION_1]-ga. Tehisintellekt näeb jälge koos leksemiga. See annab silumisabi anonümiseeritud versiooni põhjal. Tegelik mandaat ei lahkunud sisevõrgust.
See peatab sama lekke vektori, mis täidab GitHubi saladuste lekkedega. Kanal on erinev – tehisintellekti tööriistad, mitte giti kommitatavad – kuid lahendus toimib samal viisil: blokeeri enne edastamist.
Vaadake meie turbe ülevaadet selle kohta, kuidas anonym.legal seda käsitleb tehisintellekti tööriistade ja dokumentide töövoogude lõikes, ning vastavuskeskust auditi kontrollide kohta.
Tagantjärele tuvastamine on liiga hilja
Mõned meeskonnad kasutavad pärast kommiti skaneerimist lekkinud saladuste leidmiseks. GitGuardian ja truffleHog töötavad hästi GitHubi kanali jaoks. Need ei kata tehisintellekti tööriistade seansse.
Kui saladus jõuab tehisintellekti teenusepakkuja serveritesse, on kokkupuude toimunud. Skaneerimine leiab selle hiljem. MCP-kihi anonümiseerimine takistab selle jõudmist mudelini.
39 miljonit GitHubi leket dokumenteerib ühe kanali. Tehisintellekti tööriistade kokkupuude on sama probleem kanalis, millel on vähem jälgimist ja auditijälge. Ennetamine enne edastamist katab mõlemad.