39 millió hitelesítő adat szivárgott ki egy év alatt

A GitHub Octoverse 2024-es jelentése szerint 39 millió titok szivárgott ki a GitHubon 2024-ben. Ez 25%-os éves növekedés 2023-hoz képest. A kiszivárgott adatok közé tartoznak API-kulcsok, adatbázis-kapcsolati karakterláncok, hitelesítési tokenek és felhőalapú hitelesítő adatok.

Az ok ismert. A fejlesztők titkokat tartalmazó kódot hagynak jóvá. Ezek a titkok debug-munkamenetekből erednek, vagy azért kerülnek oda, mert környezeti változók helyett keményen kódolják őket. 39 millió szivárgásnál ez nem ritka jelenség – ez megszokott gyakorlat.

Az AI-eszközök egy második szivárgási csatornát nyitnak

A GitGuardian 2025-ös kutatása szerint a fejlesztők 67%-a véletlenül tett közzé titkokat kódban. Ugyanazok a szokások, amelyek GitHub-szivárgásokat okoznak, AI-eszközök szivárgásait is előidézik.

Egy fejlesztő beilleszti a kódot a Claude-ba, a ChatGPT-be vagy más AI-asszisztensbe segítségért. Ebben a kódban élő hitelesítő adatok is szerepelhetnek. Az AI-modell megkapja a titkot, amely esetleg eltárolódik a beszélgetési előzményekben, és elküldésre kerül a szolgáltató szervereire. A fejlesztő elveszíti az irányítást – figyelmeztetés nélkül.

Három példa:

Adatbázis-hibakeresés. Egy fejlesztő beilleszti a hibakövetési naplót. A napló tartalmazza a kapcsolati karakterláncot. Az AI a jelszót is megkapja.

Folyamat-felülvizsgálat. Egy fejlesztő megoszt egy adatfolyam-scriptet. A script tartalmaz egy AWS hozzáférési kulcsot és titkos kulcsot. Az AI mindkettőt megkapja.

API-integráció felülvizsgálata. Egy fejlesztő visszajelzést kér egy integrációról. A kód tartalmaz egy élő partner API-kulcsot. A kulcs elhagyja a fejlesztő hálózatát.

Mindegyik esetben a cél jogszerű segítség. A hitelesítő adat szivárgása mellékhatás, amely abból fakad, hogy a fejlesztő elegendő kontextust ad az AI-nak. Ez ugyanaz a minta, mint a GitHub-szivárgásoknál – nem rosszindulatú, csupán megszokott.

A CI/CD-folyamatok ugyanilyen kockázatnak vannak kitéve

A CI/CD-folyamatok titkos adatainak szivárgása 34%-kal nőtt 2024-ben. A build-scriptek, a telepítési konfigurációk és az infrastruktúra-mint-kód fájlok ma már AI-felülvizsgálaton mennek át. Ezek a fájlok gyakran tartalmaznak felhőalapú hitelesítő adatokat és szolgáltatásfiók-tokeneket.

Ahogy az AI-eszközök egyre több fejlesztési területet fednek le – felülvizsgálat, dokumentáció, hibakeresés, optimalizálás –, a kitettségi felület is velük együtt növekszik.

Hogyan blokkolja az MCP-architektúra a szivárgásokat

Azon csapatok számára, amelyek Claude Desktop-ot vagy Cursor IDE-t használnak, a Model Context Protocol (MCP) szerver-architektúra egy hitelesítőadat-szűrőt helyez a fejlesztő és az AI-modell közé.

Az MCP-szerver minden, a munkameneten áthaladó szöveget feldolgoz. A beillesztett kód, hibakövetési naplók, konfigurációs fájlok, debug-kontextus – minden átmegy egy anonimizálási lépésen, mielőtt a modell látná.

A motor felismeri a hitelesítőadat-mintákat: API-kulcsformátumokat, adatbázis-kapcsolati karakterláncokat, OAuth-tokeneket, privátkulcs-fejléceket és az Ön biztonsági csapata által meghatározott egyéni formátumokat. Minden egyezés tokenre cserélődik az átvitel előtt.

Ez a gyakorlatban így néz ki:

Egy fejlesztő beilleszti egy adatbázis-kapcsolati karakterláncot tartalmazó hibakövetési naplót. Az MCP-szerver a karakterláncot [DB_CONNECTION_1] tokenre cseréli. Az AI a tokennel ellátott naplót látja. Hibakeresési segítséget ad az anonimizált változat alapján. A tényleges hitelesítő adat soha nem hagyta el a belső hálózatot.

Ez ugyanazt a szivárgási vektort állítja meg, amely a GitHubot titkokkal tölti meg. A csatorna más – AI-eszközök, nem git-véglegesítések –, de a megoldás ugyanúgy működik: blokkolja az átvitel előtt.

Lásd a biztonsági áttekintőnket arról, hogyan kezeli ezt az anonym.legal AI-eszközök és dokumentum-munkafolyamatok esetén, valamint a megfelelőségi központot az auditkontrolokhoz.

Az utólagos felderítés túl késő

Néhány csapat commit utáni szkennelést alkalmaz a kiszivárgott titkok felderítésére. A GitGuardian és a truffleHog jól működik a GitHub-csatornára. Az AI-eszközök munkameneteit azonban nem fedi le.

Amikor egy titok eléri az AI-szolgáltató szervereit, a kitettség megtörtént. A szkennelés utólag találja meg. Az MCP-réteg anonimizálása megakadályozza, hogy a titok egyáltalán eljusson a modellhez.

A 39 millió GitHub-szivárgás egy csatornát dokumentál. Az AI-eszközök kitettsége ugyanaz a probléma egy kevésbé figyelt és auditnyomvonal nélküli csatornán. Az átvitel előtti megelőzés mindkettőt lefedi.

Források

Kapcsolódó Cikkek

AI Biztonság

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.

Ingyenes Próbát Kezd Funkciók Megtekintése

39 millió GitHub-szivárgás: az AI-kódolás kockázatai

39 millió hitelesítő adat szivárgott ki egy év alatt

Az AI-eszközök egy második szivárgási csatornát nyitnak

A CI/CD-folyamatok ugyanilyen kockázatnak vannak kitéve

Hogyan blokkolja az MCP-architektúra a szivárgásokat

Az utólagos felderítés túl késő

Források

Kapcsolódó Cikkek

Real-Time PII Prevention Saves $2.2M

GDPR Art. 32: AI Tools PII Monitoring

Real-Time PII Prevention for AI Data Leaks

Készen áll az adatai védelmére?

39 millió GitHub-szivárgás: az AI-kódolás kockázatai

39 millió hitelesítő adat szivárgott ki egy év alatt

Az AI-eszközök egy második szivárgási csatornát nyitnak

A CI/CD-folyamatok ugyanilyen kockázatnak vannak kitéve

Hogyan blokkolja az MCP-architektúra a szivárgásokat

Az utólagos felderítés túl késő

Források

Kapcsolódó Cikkek

Real-Time PII Prevention Saves $2.2M

GDPR Art. 32: AI Tools PII Monitoring

Real-Time PII Prevention for AI Data Leaks

Készen áll az adatai védelmére?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow