एक वर्ष में 39 मिलियन क्रेडेंशियल लीक हुए
GitHub की Octoverse 2024 रिपोर्ट में 2024 में GitHub पर 39 मिलियन सीक्रेट लीक पाए गए। यह 2023 से साल-दर-साल 25% की वृद्धि है। सीक्रेट में API कुंजियाँ, डेटाबेस स्ट्रिंग, ऑथ टोकन और क्लाउड क्रेडेंशियल शामिल हैं।
कारण ज्ञात है। डेवलपर्स सीक्रेट के साथ कोड कमिट करते हैं। सीक्रेट डीबग सत्रों से आते हैं। या वे एनवायरनमेंट वेरिएबल में संग्रहीत करने की बजाय हार्डकोड किए जाते हैं। 39 मिलियन लीक पर, यह दुर्लभ नहीं है। यह नियमित है।
AI टूल एक दूसरा लीक चैनल जोड़ते हैं
GitGuardian के 2025 शोध ने पाया कि 67% डेवलपर्स ने गलती से कोड में सीक्रेट उजागर किए हैं। वही आदतें जो GitHub लीक बनाती हैं, AI टूल लीक भी बनाती हैं।
एक डेवलपर मदद के लिए Claude, ChatGPT या किसी अन्य AI असिस्टेंट में कोड पेस्ट करता है। उस कोड में अक्सर लाइव क्रेडेंशियल होते हैं। AI मॉडल को सीक्रेट मिलता है। यह इसे बातचीत इतिहास में स्टोर कर सकता है। यह इसे प्रदाता के सर्वर पर भेजता है। डेवलपर नियंत्रण खो देता है — बिना किसी चेतावनी के।
तीन उदाहरण:
डेटाबेस डीबगिंग। एक डेवलपर स्टैक ट्रेस पेस्ट करता है। ट्रेस में कनेक्शन स्ट्रिंग शामिल है। AI पासवर्ड भी पढ़ता है।
पाइपलाइन समीक्षा। एक डेवलपर डेटा पाइपलाइन स्क्रिप्ट साझा करता है। स्क्रिप्ट में AWS एक्सेस की और सीक्रेट की है। AI दोनों प्राप्त करता है।
API एकीकरण समीक्षा। एक डेवलपर एकीकरण पर फ़ीडबैक माँगता है। कोड में एक लाइव पार्टनर API कुंजी शामिल है। कुंजी डेवलपर के नेटवर्क से बाहर जाती है।
हर मामले में, लक्ष्य वैध मदद है। क्रेडेंशियल लीक AI को पर्याप्त संदर्भ देने का साइड इफ़ेक्ट है। यह GitHub लीक जैसा ही पैटर्न है — दुर्भावनापूर्ण नहीं, बस नियमित।
CI/CD पाइपलाइन भी यही जोखिम सामना करती हैं
CI/CD पाइपलाइन सीक्रेट लीक 2024 में 34% बढ़े। बिल्ड स्क्रिप्ट, डिप्लॉयमेंट कॉन्फ़िग और इंफ्रास्ट्रक्चर-ऐज़-कोड फ़ाइलें अब AI समीक्षा से गुज़रती हैं। इन फ़ाइलों में अक्सर क्लाउड क्रेडेंशियल और सर्विस अकाउंट टोकन होते हैं।
जैसे-जैसे AI टूल dev साइकिल को अधिक कवर करते हैं — समीक्षा, डॉक्स, डीबगिंग, ऑप्टिमाइज़ेशन — उनके साथ एक्सपोज़र सतह बढ़ती है।
MCP आर्किटेक्चर लीक कैसे रोकता है
Claude Desktop या Cursor IDE का उपयोग करने वाली टीमों के लिए, Model Context Protocol (MCP) सर्वर आर्किटेक्चर डेवलपर और AI मॉडल के बीच के रास्ते में एक क्रेडेंशियल फ़िल्टर डालता है।
MCP सर्वर हर उस पाठ को संभालता है जो सत्र से होकर गुज़रता है। पेस्ट किया गया कोड, स्टैक ट्रेस, कॉन्फ़िग फ़ाइलें, डीबग संदर्भ — सब कुछ मॉडल को दिखाई देने से पहले गुमनामीकरण चरण से गुज़रता है।
इंजन क्रेडेंशियल पैटर्न खोजता है: API कुंजी फ़ॉर्मेट, डेटाबेस स्ट्रिंग, OAuth टोकन, प्राइवेट कुंजी हेडर, और आपकी सुरक्षा टीम द्वारा परिभाषित कस्टम फ़ॉर्मेट। ट्रांसमिशन से पहले प्रत्येक मिलान को एक टोकन से बदल दिया जाता है।
यह व्यवहार में कैसा दिखता है:
एक डेवलपर डेटाबेस कनेक्शन स्ट्रिंग के साथ स्टैक ट्रेस पेस्ट करता है। MCP सर्वर स्ट्रिंग को [DB_CONNECTION_1] से बदल देता है। AI टोकन के साथ ट्रेस देखता है। यह गुमनाम संस्करण के आधार पर डीबगिंग सहायता देता है। वास्तविक क्रेडेंशियल कभी आंतरिक नेटवर्क नहीं छोड़ा।
यह उसी लीक वेक्टर को रोकता है जो GitHub को सीक्रेट से भरता है। चैनल अलग है — AI टूल, git कमिट नहीं — लेकिन समाधान उसी तरह काम करता है: ट्रांसमिट होने से पहले इसे ब्लॉक करें।
देखें हमारा सुरक्षा अवलोकन यह जानने के लिए कि anonym.legal AI टूल और दस्तावेज़ वर्कफ़्लो में इसे कैसे संभालता है, और अनुपालन केंद्र ऑडिट नियंत्रणों के लिए।
पता लगाना बाद में बहुत देर हो जाती है
कुछ टीमें लीक हुए सीक्रेट पकड़ने के लिए पोस्ट-कमिट स्कैनिंग का उपयोग करती हैं। GitGuardian और truffleHog GitHub चैनल के लिए अच्छी तरह काम करते हैं। वे AI टूल सत्रों को कवर नहीं करते।
जब कोई सीक्रेट AI प्रदाता के सर्वर तक पहुँचता है, तो एक्सपोज़र हो जाता है। स्कैनिंग बाद में इसे खोजती है। MCP-परत गुमनामीकरण इसे मॉडल तक पहुँचने से पहले रोकता है।
39 मिलियन GitHub लीक एक चैनल का दस्तावेज़ीकरण करते हैं। AI टूल एक्सपोज़र कम निगरानी और कोई ऑडिट ट्रेल वाले चैनल में समान समस्या है। ट्रांसमिशन से पहले रोकथाम दोनों को कवर करती है।