۳۹ میلیون اعتبارنامه در یک سال نشت پیدا کرد

گزارش Octoverse 2024 گیت‌هاب ۳۹ میلیون راز نشت‌پیداکرده در GitHub در سال ۲۰۲۴ را نشان داد. این ۲۵٪ افزایش سال به سال نسبت به ۲۰۲۳ است. اسرار شامل کلیدهای API، رشته‌های پایگاه داده، توکن‌های احراز هویت و اعتبارنامه‌های ابری هستند.

علت آن مشخص است. توسعه‌دهندگان کدی را که اسرار در آن است کامیت می‌کنند. اسرار از جلسات اشکال‌زدایی می‌آیند. یا به جای ذخیره در متغیرهای محیطی به‌صورت سخت‌کد شده هستند. با ۳۹ میلیون نشت، این نادر نیست. این امری معمول است.

ابزارهای هوش مصنوعی یک کانال نشت دوم ایجاد می‌کنند

تحقیقات GitGuardian در سال ۲۰۲۵ نشان داد که ۶۷٪ از توسعه‌دهندگان به‌طور تصادفی اسرار را در کد افشا کرده‌اند. همان عادت‌هایی که نشت‌های GitHub ایجاد می‌کنند، نشت‌های ابزار هوش مصنوعی را هم ایجاد می‌کنند.

یک توسعه‌دهنده کد را در Claude، ChatGPT یا یک دستیار هوش مصنوعی دیگر برای کمک paste می‌کند. آن کد اغلب اعتبارنامه‌های زنده در آن دارد. مدل هوش مصنوعی راز را دریافت می‌کند. ممکن است آن را در تاریخچه مکالمه ذخیره کند. آن را به سرورهای ارائه‌دهنده می‌فرستد. توسعه‌دهنده کنترل را از دست می‌دهد — بدون هشدار.

سه مثال:

اشکال‌زدایی پایگاه داده. توسعه‌دهنده یک stack trace paste می‌کند. trace شامل رشته اتصال است. هوش مصنوعی هم رمز عبور را می‌خواند.

بررسی pipeline. توسعه‌دهنده یک اسکریپت data pipeline به اشتراک می‌گذارد. اسکریپت یک کلید دسترسی AWS و کلید مخفی دارد. هوش مصنوعی هر دو را دریافت می‌کند.

بررسی یکپارچه‌سازی API. توسعه‌دهنده برای بازخورد روی یک یکپارچه‌سازی درخواست می‌کند. کد یک کلید API partner زنده دارد. کلید شبکه توسعه‌دهنده را ترک می‌کند.

در هر مورد هدف کمک مشروع است. نشت اعتبارنامه یک اثر جانبی دادن زمینه کافی به هوش مصنوعی است. این همان الگوی نشت‌های GitHub است — نه مخرب، فقط معمول.

خطوط CI/CD با همین خطر روبرو هستند

نشت‌های راز خط CI/CD در سال ۲۰۲۴ ۳۴٪ افزایش یافت. اسکریپت‌های build، تنظیمات استقرار و فایل‌های infrastructure-as-code همه اکنون از طریق بررسی هوش مصنوعی عبور می‌کنند. این فایل‌ها اغلب اعتبارنامه‌های ابری و توکن‌های حساب سرویس دارند.

با گسترش ابزارهای هوش مصنوعی در بیشتر چرخه توسعه — بررسی، مستندسازی، اشکال‌زدایی، بهینه‌سازی — سطح افشا هم با آن‌ها گسترش می‌یابد.

چگونه معماری MCP نشت‌ها را مسدود می‌کند

برای تیم‌هایی که از Claude Desktop یا Cursor IDE استفاده می‌کنند، معماری سرور Model Context Protocol (MCP) یک فیلتر اعتبارنامه بین توسعه‌دهنده و مدل هوش مصنوعی قرار می‌دهد.

سرور MCP هر متنی که از طریق جلسه عبور می‌کند را مدیریت می‌کند. کد paste‌شده، stack trace‌ها، فایل‌های پیکربندی، زمینه اشکال‌زدایی — همه آن‌ها قبل از اینکه مدل ببیند از یک مرحله ناشناسی‌سازی عبور می‌کنند.

موتور الگوهای اعتبارنامه را پیدا می‌کند: قالب‌های کلید API، رشته‌های پایگاه داده، توکن‌های OAuth، سرآیندهای کلید خصوصی و قالب‌های سفارشی که تیم امنیتی‌تان تعریف می‌کند. هر تطابق قبل از انتقال با یک توکن جایگزین می‌شود.

نحوه کار در عمل:

یک توسعه‌دهنده یک stack trace با یک رشته اتصال پایگاه داده paste می‌کند. سرور MCP رشته را با [DB_CONNECTION_1] جایگزین می‌کند. هوش مصنوعی trace را با توکن در جایش می‌بیند. کمک اشکال‌زدایی بر اساس نسخه ناشناس ارائه می‌دهد. اعتبارنامه واقعی هرگز شبکه داخلی را ترک نکرد.

این همان بردار نشتی را متوقف می‌کند که GitHub را با اسرار پر می‌کند. کانال متفاوت است — ابزارهای هوش مصنوعی، نه git commit‌ها — اما راه‌حل به همان شکل کار می‌کند: قبل از انتقال مسدود کنید.

برای نحوه مدیریت anonym.legal در ابزارهای هوش مصنوعی و گردش‌های کاری اسناد، مرور امنیتی ما را ببینید و برای کنترل‌های حسابرسی، مرکز انطباق را مراجعه کنید.

تشخیص پس از واقعه خیلی دیر است

بعضی تیم‌ها از اسکن پس از کامیت برای پیدا کردن اسرار نشت‌یافته استفاده می‌کنند. GitGuardian و truffleHog برای کانال GitHub به‌خوبی کار می‌کنند. جلسات ابزار هوش مصنوعی را پوشش نمی‌دهند.

وقتی یک راز به سرورهای ارائه‌دهنده هوش مصنوعی می‌رسد، افشا اتفاق افتاده است. اسکن آن را بعد پیدا می‌کند. ناشناسی‌سازی در لایه MCP مانع از رسیدن آن به مدل می‌شود.

۳۹ میلیون نشت GitHub یک کانال را مستند می‌کند. افشای ابزار هوش مصنوعی همان مشکل در کانالی با نظارت کمتر و بدون مسیر حسابرسی است. پیشگیری قبل از انتقال هر دو را پوشش می‌دهد.

منابع

مقالات مرتبط

امنیت هوش مصنوعی

آماده‌اید داده‌های خود را محافظت کنید؟

شروع به ناشناس‌سازی PII با بیش از ۲۸۵ نوع نهاد در ۴۸ زبان.

آغاز دوره آزمایشی رایگان مشاهده ویژگی‌ها

۳۹ میلیون نشت در GitHub: خطر کدنویسی با هوش مصنوعی

۳۹ میلیون اعتبارنامه در یک سال نشت پیدا کرد

ابزارهای هوش مصنوعی یک کانال نشت دوم ایجاد می‌کنند

خطوط CI/CD با همین خطر روبرو هستند

چگونه معماری MCP نشت‌ها را مسدود می‌کند

تشخیص پس از واقعه خیلی دیر است

منابع

مقالات مرتبط

Real-Time PII Prevention Saves $2.2M

GDPR Art. 32: AI Tools PII Monitoring

Real-Time PII Prevention for AI Data Leaks

آماده‌اید داده‌های خود را محافظت کنید؟

۳۹ میلیون نشت در GitHub: خطر کدنویسی با هوش مصنوعی

۳۹ میلیون اعتبارنامه در یک سال نشت پیدا کرد

ابزارهای هوش مصنوعی یک کانال نشت دوم ایجاد می‌کنند

خطوط CI/CD با همین خطر روبرو هستند

چگونه معماری MCP نشت‌ها را مسدود می‌کند

تشخیص پس از واقعه خیلی دیر است

منابع

مقالات مرتبط

Real-Time PII Prevention Saves $2.2M

GDPR Art. 32: AI Tools PII Monitoring

Real-Time PII Prevention for AI Data Leaks

آماده‌اید داده‌های خود را محافظت کنید؟

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow