39 millió hitelesítő adat szivárgott ki egy év alatt
A GitHub Octoverse 2024-es jelentése szerint 39 millió titok szivárgott ki a GitHubon 2024-ben. Ez 25%-os éves növekedés 2023-hoz képest. A kiszivárgott adatok közé tartoznak API-kulcsok, adatbázis-kapcsolati karakterláncok, hitelesítési tokenek és felhőalapú hitelesítő adatok.
Az ok ismert. A fejlesztők titkokat tartalmazó kódot hagynak jóvá. Ezek a titkok debug-munkamenetekből erednek, vagy azért kerülnek oda, mert környezeti változók helyett keményen kódolják őket. 39 millió szivárgásnál ez nem ritka jelenség – ez megszokott gyakorlat.
Az AI-eszközök egy második szivárgási csatornát nyitnak
A GitGuardian 2025-ös kutatása szerint a fejlesztők 67%-a véletlenül tett közzé titkokat kódban. Ugyanazok a szokások, amelyek GitHub-szivárgásokat okoznak, AI-eszközök szivárgásait is előidézik.
Egy fejlesztő beilleszti a kódot a Claude-ba, a ChatGPT-be vagy más AI-asszisztensbe segítségért. Ebben a kódban élő hitelesítő adatok is szerepelhetnek. Az AI-modell megkapja a titkot, amely esetleg eltárolódik a beszélgetési előzményekben, és elküldésre kerül a szolgáltató szervereire. A fejlesztő elveszíti az irányítást – figyelmeztetés nélkül.
Három példa:
Adatbázis-hibakeresés. Egy fejlesztő beilleszti a hibakövetési naplót. A napló tartalmazza a kapcsolati karakterláncot. Az AI a jelszót is megkapja.
Folyamat-felülvizsgálat. Egy fejlesztő megoszt egy adatfolyam-scriptet. A script tartalmaz egy AWS hozzáférési kulcsot és titkos kulcsot. Az AI mindkettőt megkapja.
API-integráció felülvizsgálata. Egy fejlesztő visszajelzést kér egy integrációról. A kód tartalmaz egy élő partner API-kulcsot. A kulcs elhagyja a fejlesztő hálózatát.
Mindegyik esetben a cél jogszerű segítség. A hitelesítő adat szivárgása mellékhatás, amely abból fakad, hogy a fejlesztő elegendő kontextust ad az AI-nak. Ez ugyanaz a minta, mint a GitHub-szivárgásoknál – nem rosszindulatú, csupán megszokott.
A CI/CD-folyamatok ugyanilyen kockázatnak vannak kitéve
A CI/CD-folyamatok titkos adatainak szivárgása 34%-kal nőtt 2024-ben. A build-scriptek, a telepítési konfigurációk és az infrastruktúra-mint-kód fájlok ma már AI-felülvizsgálaton mennek át. Ezek a fájlok gyakran tartalmaznak felhőalapú hitelesítő adatokat és szolgáltatásfiók-tokeneket.
Ahogy az AI-eszközök egyre több fejlesztési területet fednek le – felülvizsgálat, dokumentáció, hibakeresés, optimalizálás –, a kitettségi felület is velük együtt növekszik.
Hogyan blokkolja az MCP-architektúra a szivárgásokat
Azon csapatok számára, amelyek Claude Desktop-ot vagy Cursor IDE-t használnak, a Model Context Protocol (MCP) szerver-architektúra egy hitelesítőadat-szűrőt helyez a fejlesztő és az AI-modell közé.
Az MCP-szerver minden, a munkameneten áthaladó szöveget feldolgoz. A beillesztett kód, hibakövetési naplók, konfigurációs fájlok, debug-kontextus – minden átmegy egy anonimizálási lépésen, mielőtt a modell látná.
A motor felismeri a hitelesítőadat-mintákat: API-kulcsformátumokat, adatbázis-kapcsolati karakterláncokat, OAuth-tokeneket, privátkulcs-fejléceket és az Ön biztonsági csapata által meghatározott egyéni formátumokat. Minden egyezés tokenre cserélődik az átvitel előtt.
Ez a gyakorlatban így néz ki:
Egy fejlesztő beilleszti egy adatbázis-kapcsolati karakterláncot tartalmazó hibakövetési naplót. Az MCP-szerver a karakterláncot [DB_CONNECTION_1] tokenre cseréli. Az AI a tokennel ellátott naplót látja. Hibakeresési segítséget ad az anonimizált változat alapján. A tényleges hitelesítő adat soha nem hagyta el a belső hálózatot.
Ez ugyanazt a szivárgási vektort állítja meg, amely a GitHubot titkokkal tölti meg. A csatorna más – AI-eszközök, nem git-véglegesítések –, de a megoldás ugyanúgy működik: blokkolja az átvitel előtt.
Lásd a biztonsági áttekintőnket arról, hogyan kezeli ezt az anonym.legal AI-eszközök és dokumentum-munkafolyamatok esetén, valamint a megfelelőségi központot az auditkontrolokhoz.
Az utólagos felderítés túl késő
Néhány csapat commit utáni szkennelést alkalmaz a kiszivárgott titkok felderítésére. A GitGuardian és a truffleHog jól működik a GitHub-csatornára. Az AI-eszközök munkameneteit azonban nem fedi le.
Amikor egy titok eléri az AI-szolgáltató szervereit, a kitettség megtörtént. A szkennelés utólag találja meg. Az MCP-réteg anonimizálása megakadályozza, hogy a titok egyáltalán eljusson a modellhez.
A 39 millió GitHub-szivárgás egy csatornát dokumentál. Az AI-eszközök kitettsége ugyanaz a probléma egy kevésbé figyelt és auditnyomvonal nélküli csatornán. Az átvitel előtti megelőzés mindkettőt lefedi.