एक वर्ष में 39 मिलियन क्रेडेंशियल लीक हुए

GitHub की Octoverse 2024 रिपोर्ट में 2024 में GitHub पर 39 मिलियन सीक्रेट लीक पाए गए। यह 2023 से साल-दर-साल 25% की वृद्धि है। सीक्रेट में API कुंजियाँ, डेटाबेस स्ट्रिंग, ऑथ टोकन और क्लाउड क्रेडेंशियल शामिल हैं।

कारण ज्ञात है। डेवलपर्स सीक्रेट के साथ कोड कमिट करते हैं। सीक्रेट डीबग सत्रों से आते हैं। या वे एनवायरनमेंट वेरिएबल में संग्रहीत करने की बजाय हार्डकोड किए जाते हैं। 39 मिलियन लीक पर, यह दुर्लभ नहीं है। यह नियमित है।

AI टूल एक दूसरा लीक चैनल जोड़ते हैं

GitGuardian के 2025 शोध ने पाया कि 67% डेवलपर्स ने गलती से कोड में सीक्रेट उजागर किए हैं। वही आदतें जो GitHub लीक बनाती हैं, AI टूल लीक भी बनाती हैं।

एक डेवलपर मदद के लिए Claude, ChatGPT या किसी अन्य AI असिस्टेंट में कोड पेस्ट करता है। उस कोड में अक्सर लाइव क्रेडेंशियल होते हैं। AI मॉडल को सीक्रेट मिलता है। यह इसे बातचीत इतिहास में स्टोर कर सकता है। यह इसे प्रदाता के सर्वर पर भेजता है। डेवलपर नियंत्रण खो देता है — बिना किसी चेतावनी के।

तीन उदाहरण:

डेटाबेस डीबगिंग। एक डेवलपर स्टैक ट्रेस पेस्ट करता है। ट्रेस में कनेक्शन स्ट्रिंग शामिल है। AI पासवर्ड भी पढ़ता है।

पाइपलाइन समीक्षा। एक डेवलपर डेटा पाइपलाइन स्क्रिप्ट साझा करता है। स्क्रिप्ट में AWS एक्सेस की और सीक्रेट की है। AI दोनों प्राप्त करता है।

API एकीकरण समीक्षा। एक डेवलपर एकीकरण पर फ़ीडबैक माँगता है। कोड में एक लाइव पार्टनर API कुंजी शामिल है। कुंजी डेवलपर के नेटवर्क से बाहर जाती है।

हर मामले में, लक्ष्य वैध मदद है। क्रेडेंशियल लीक AI को पर्याप्त संदर्भ देने का साइड इफ़ेक्ट है। यह GitHub लीक जैसा ही पैटर्न है — दुर्भावनापूर्ण नहीं, बस नियमित।

CI/CD पाइपलाइन भी यही जोखिम सामना करती हैं

CI/CD पाइपलाइन सीक्रेट लीक 2024 में 34% बढ़े। बिल्ड स्क्रिप्ट, डिप्लॉयमेंट कॉन्फ़िग और इंफ्रास्ट्रक्चर-ऐज़-कोड फ़ाइलें अब AI समीक्षा से गुज़रती हैं। इन फ़ाइलों में अक्सर क्लाउड क्रेडेंशियल और सर्विस अकाउंट टोकन होते हैं।

जैसे-जैसे AI टूल dev साइकिल को अधिक कवर करते हैं — समीक्षा, डॉक्स, डीबगिंग, ऑप्टिमाइज़ेशन — उनके साथ एक्सपोज़र सतह बढ़ती है।

MCP आर्किटेक्चर लीक कैसे रोकता है

Claude Desktop या Cursor IDE का उपयोग करने वाली टीमों के लिए, Model Context Protocol (MCP) सर्वर आर्किटेक्चर डेवलपर और AI मॉडल के बीच के रास्ते में एक क्रेडेंशियल फ़िल्टर डालता है।

MCP सर्वर हर उस पाठ को संभालता है जो सत्र से होकर गुज़रता है। पेस्ट किया गया कोड, स्टैक ट्रेस, कॉन्फ़िग फ़ाइलें, डीबग संदर्भ — सब कुछ मॉडल को दिखाई देने से पहले गुमनामीकरण चरण से गुज़रता है।

इंजन क्रेडेंशियल पैटर्न खोजता है: API कुंजी फ़ॉर्मेट, डेटाबेस स्ट्रिंग, OAuth टोकन, प्राइवेट कुंजी हेडर, और आपकी सुरक्षा टीम द्वारा परिभाषित कस्टम फ़ॉर्मेट। ट्रांसमिशन से पहले प्रत्येक मिलान को एक टोकन से बदल दिया जाता है।

यह व्यवहार में कैसा दिखता है:

एक डेवलपर डेटाबेस कनेक्शन स्ट्रिंग के साथ स्टैक ट्रेस पेस्ट करता है। MCP सर्वर स्ट्रिंग को [DB_CONNECTION_1] से बदल देता है। AI टोकन के साथ ट्रेस देखता है। यह गुमनाम संस्करण के आधार पर डीबगिंग सहायता देता है। वास्तविक क्रेडेंशियल कभी आंतरिक नेटवर्क नहीं छोड़ा।

यह उसी लीक वेक्टर को रोकता है जो GitHub को सीक्रेट से भरता है। चैनल अलग है — AI टूल, git कमिट नहीं — लेकिन समाधान उसी तरह काम करता है: ट्रांसमिट होने से पहले इसे ब्लॉक करें।

देखें हमारा सुरक्षा अवलोकन यह जानने के लिए कि anonym.legal AI टूल और दस्तावेज़ वर्कफ़्लो में इसे कैसे संभालता है, और अनुपालन केंद्र ऑडिट नियंत्रणों के लिए।

पता लगाना बाद में बहुत देर हो जाती है

कुछ टीमें लीक हुए सीक्रेट पकड़ने के लिए पोस्ट-कमिट स्कैनिंग का उपयोग करती हैं। GitGuardian और truffleHog GitHub चैनल के लिए अच्छी तरह काम करते हैं। वे AI टूल सत्रों को कवर नहीं करते।

जब कोई सीक्रेट AI प्रदाता के सर्वर तक पहुँचता है, तो एक्सपोज़र हो जाता है। स्कैनिंग बाद में इसे खोजती है। MCP-परत गुमनामीकरण इसे मॉडल तक पहुँचने से पहले रोकता है।

39 मिलियन GitHub लीक एक चैनल का दस्तावेज़ीकरण करते हैं। AI टूल एक्सपोज़र कम निगरानी और कोई ऑडिट ट्रेल वाले चैनल में समान समस्या है। ट्रांसमिशन से पहले रोकथाम दोनों को कवर करती है।

स्रोत

क्या आप अपने डेटा की सुरक्षा के लिए तैयार हैं?

48 भाषाओं में 285+ संस्थाओं के प्रकारों के साथ PII अनामकरण शुरू करें।

फ्री ट्रायल शुरू करें विशेषताएँ देखें

39M GitHub लीक: AI कोडिंग जोखिम

एक वर्ष में 39 मिलियन क्रेडेंशियल लीक हुए

AI टूल एक दूसरा लीक चैनल जोड़ते हैं

CI/CD पाइपलाइन भी यही जोखिम सामना करती हैं

MCP आर्किटेक्चर लीक कैसे रोकता है

पता लगाना बाद में बहुत देर हो जाती है

स्रोत

संबंधित लेख

Real-Time PII Prevention Saves $2.2M

GDPR Art. 32: AI Tools PII Monitoring

Real-Time PII Prevention for AI Data Leaks

क्या आप अपने डेटा की सुरक्षा के लिए तैयार हैं?

39M GitHub लीक: AI कोडिंग जोखिम

एक वर्ष में 39 मिलियन क्रेडेंशियल लीक हुए

AI टूल एक दूसरा लीक चैनल जोड़ते हैं

CI/CD पाइपलाइन भी यही जोखिम सामना करती हैं

MCP आर्किटेक्चर लीक कैसे रोकता है

पता लगाना बाद में बहुत देर हो जाती है

स्रोत

संबंधित लेख

Real-Time PII Prevention Saves $2.2M

GDPR Art. 32: AI Tools PII Monitoring

Real-Time PII Prevention for AI Data Leaks

क्या आप अपने डेटा की सुरक्षा के लिए तैयार हैं?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow