۳۹ میلیون اعتبارنامه در یک سال نشت پیدا کرد
گزارش Octoverse 2024 گیتهاب ۳۹ میلیون راز نشتپیداکرده در GitHub در سال ۲۰۲۴ را نشان داد. این ۲۵٪ افزایش سال به سال نسبت به ۲۰۲۳ است. اسرار شامل کلیدهای API، رشتههای پایگاه داده، توکنهای احراز هویت و اعتبارنامههای ابری هستند.
علت آن مشخص است. توسعهدهندگان کدی را که اسرار در آن است کامیت میکنند. اسرار از جلسات اشکالزدایی میآیند. یا به جای ذخیره در متغیرهای محیطی بهصورت سختکد شده هستند. با ۳۹ میلیون نشت، این نادر نیست. این امری معمول است.
ابزارهای هوش مصنوعی یک کانال نشت دوم ایجاد میکنند
تحقیقات GitGuardian در سال ۲۰۲۵ نشان داد که ۶۷٪ از توسعهدهندگان بهطور تصادفی اسرار را در کد افشا کردهاند. همان عادتهایی که نشتهای GitHub ایجاد میکنند، نشتهای ابزار هوش مصنوعی را هم ایجاد میکنند.
یک توسعهدهنده کد را در Claude، ChatGPT یا یک دستیار هوش مصنوعی دیگر برای کمک paste میکند. آن کد اغلب اعتبارنامههای زنده در آن دارد. مدل هوش مصنوعی راز را دریافت میکند. ممکن است آن را در تاریخچه مکالمه ذخیره کند. آن را به سرورهای ارائهدهنده میفرستد. توسعهدهنده کنترل را از دست میدهد — بدون هشدار.
سه مثال:
اشکالزدایی پایگاه داده. توسعهدهنده یک stack trace paste میکند. trace شامل رشته اتصال است. هوش مصنوعی هم رمز عبور را میخواند.
بررسی pipeline. توسعهدهنده یک اسکریپت data pipeline به اشتراک میگذارد. اسکریپت یک کلید دسترسی AWS و کلید مخفی دارد. هوش مصنوعی هر دو را دریافت میکند.
بررسی یکپارچهسازی API. توسعهدهنده برای بازخورد روی یک یکپارچهسازی درخواست میکند. کد یک کلید API partner زنده دارد. کلید شبکه توسعهدهنده را ترک میکند.
در هر مورد هدف کمک مشروع است. نشت اعتبارنامه یک اثر جانبی دادن زمینه کافی به هوش مصنوعی است. این همان الگوی نشتهای GitHub است — نه مخرب، فقط معمول.
خطوط CI/CD با همین خطر روبرو هستند
نشتهای راز خط CI/CD در سال ۲۰۲۴ ۳۴٪ افزایش یافت. اسکریپتهای build، تنظیمات استقرار و فایلهای infrastructure-as-code همه اکنون از طریق بررسی هوش مصنوعی عبور میکنند. این فایلها اغلب اعتبارنامههای ابری و توکنهای حساب سرویس دارند.
با گسترش ابزارهای هوش مصنوعی در بیشتر چرخه توسعه — بررسی، مستندسازی، اشکالزدایی، بهینهسازی — سطح افشا هم با آنها گسترش مییابد.
چگونه معماری MCP نشتها را مسدود میکند
برای تیمهایی که از Claude Desktop یا Cursor IDE استفاده میکنند، معماری سرور Model Context Protocol (MCP) یک فیلتر اعتبارنامه بین توسعهدهنده و مدل هوش مصنوعی قرار میدهد.
سرور MCP هر متنی که از طریق جلسه عبور میکند را مدیریت میکند. کد pasteشده، stack traceها، فایلهای پیکربندی، زمینه اشکالزدایی — همه آنها قبل از اینکه مدل ببیند از یک مرحله ناشناسیسازی عبور میکنند.
موتور الگوهای اعتبارنامه را پیدا میکند: قالبهای کلید API، رشتههای پایگاه داده، توکنهای OAuth، سرآیندهای کلید خصوصی و قالبهای سفارشی که تیم امنیتیتان تعریف میکند. هر تطابق قبل از انتقال با یک توکن جایگزین میشود.
نحوه کار در عمل:
یک توسعهدهنده یک stack trace با یک رشته اتصال پایگاه داده paste میکند. سرور MCP رشته را با [DB_CONNECTION_1] جایگزین میکند. هوش مصنوعی trace را با توکن در جایش میبیند. کمک اشکالزدایی بر اساس نسخه ناشناس ارائه میدهد. اعتبارنامه واقعی هرگز شبکه داخلی را ترک نکرد.
این همان بردار نشتی را متوقف میکند که GitHub را با اسرار پر میکند. کانال متفاوت است — ابزارهای هوش مصنوعی، نه git commitها — اما راهحل به همان شکل کار میکند: قبل از انتقال مسدود کنید.
برای نحوه مدیریت anonym.legal در ابزارهای هوش مصنوعی و گردشهای کاری اسناد، مرور امنیتی ما را ببینید و برای کنترلهای حسابرسی، مرکز انطباق را مراجعه کنید.
تشخیص پس از واقعه خیلی دیر است
بعضی تیمها از اسکن پس از کامیت برای پیدا کردن اسرار نشتیافته استفاده میکنند. GitGuardian و truffleHog برای کانال GitHub بهخوبی کار میکنند. جلسات ابزار هوش مصنوعی را پوشش نمیدهند.
وقتی یک راز به سرورهای ارائهدهنده هوش مصنوعی میرسد، افشا اتفاق افتاده است. اسکن آن را بعد پیدا میکند. ناشناسیسازی در لایه MCP مانع از رسیدن آن به مدل میشود.
۳۹ میلیون نشت GitHub یک کانال را مستند میکند. افشای ابزار هوش مصنوعی همان مشکل در کانالی با نظارت کمتر و بدون مسیر حسابرسی است. پیشگیری قبل از انتقال هر دو را پوشش میدهد.