By · Last updated 2026-03-29

بازگشت به وبلاگامنیت هوش مصنوعی

۳۹ میلیون نشت در GitHub: خطر کدنویسی با هوش مصنوعی

۶۷٪ از توسعه‌دهندگان اسرار را به‌طور تصادفی در کد افشا کرده‌اند (GitGuardian 2025). ۳۹ میلیون راز در GitHub در سال ۲۰۲۴ نشت پیدا کرد که ۲۵٪ نسبت به سال قبل افزایش داشته است.

March 29, 20268 دقیقه مطالعه
GitHub secret leaksdeveloper AI securitycredential exposureMCP Server protectionGitGuardian 2025

۳۹ میلیون اعتبارنامه در یک سال نشت پیدا کرد

گزارش Octoverse 2024 گیت‌هاب ۳۹ میلیون راز نشت‌پیداکرده در GitHub در سال ۲۰۲۴ را نشان داد. این ۲۵٪ افزایش سال به سال نسبت به ۲۰۲۳ است. اسرار شامل کلیدهای API، رشته‌های پایگاه داده، توکن‌های احراز هویت و اعتبارنامه‌های ابری هستند.

علت آن مشخص است. توسعه‌دهندگان کدی را که اسرار در آن است کامیت می‌کنند. اسرار از جلسات اشکال‌زدایی می‌آیند. یا به جای ذخیره در متغیرهای محیطی به‌صورت سخت‌کد شده هستند. با ۳۹ میلیون نشت، این نادر نیست. این امری معمول است.

ابزارهای هوش مصنوعی یک کانال نشت دوم ایجاد می‌کنند

تحقیقات GitGuardian در سال ۲۰۲۵ نشان داد که ۶۷٪ از توسعه‌دهندگان به‌طور تصادفی اسرار را در کد افشا کرده‌اند. همان عادت‌هایی که نشت‌های GitHub ایجاد می‌کنند، نشت‌های ابزار هوش مصنوعی را هم ایجاد می‌کنند.

یک توسعه‌دهنده کد را در Claude، ChatGPT یا یک دستیار هوش مصنوعی دیگر برای کمک paste می‌کند. آن کد اغلب اعتبارنامه‌های زنده در آن دارد. مدل هوش مصنوعی راز را دریافت می‌کند. ممکن است آن را در تاریخچه مکالمه ذخیره کند. آن را به سرورهای ارائه‌دهنده می‌فرستد. توسعه‌دهنده کنترل را از دست می‌دهد — بدون هشدار.

سه مثال:

اشکال‌زدایی پایگاه داده. توسعه‌دهنده یک stack trace paste می‌کند. trace شامل رشته اتصال است. هوش مصنوعی هم رمز عبور را می‌خواند.

بررسی pipeline. توسعه‌دهنده یک اسکریپت data pipeline به اشتراک می‌گذارد. اسکریپت یک کلید دسترسی AWS و کلید مخفی دارد. هوش مصنوعی هر دو را دریافت می‌کند.

بررسی یکپارچه‌سازی API. توسعه‌دهنده برای بازخورد روی یک یکپارچه‌سازی درخواست می‌کند. کد یک کلید API partner زنده دارد. کلید شبکه توسعه‌دهنده را ترک می‌کند.

در هر مورد هدف کمک مشروع است. نشت اعتبارنامه یک اثر جانبی دادن زمینه کافی به هوش مصنوعی است. این همان الگوی نشت‌های GitHub است — نه مخرب، فقط معمول.

خطوط CI/CD با همین خطر روبرو هستند

نشت‌های راز خط CI/CD در سال ۲۰۲۴ ۳۴٪ افزایش یافت. اسکریپت‌های build، تنظیمات استقرار و فایل‌های infrastructure-as-code همه اکنون از طریق بررسی هوش مصنوعی عبور می‌کنند. این فایل‌ها اغلب اعتبارنامه‌های ابری و توکن‌های حساب سرویس دارند.

با گسترش ابزارهای هوش مصنوعی در بیشتر چرخه توسعه — بررسی، مستندسازی، اشکال‌زدایی، بهینه‌سازی — سطح افشا هم با آن‌ها گسترش می‌یابد.

چگونه معماری MCP نشت‌ها را مسدود می‌کند

برای تیم‌هایی که از Claude Desktop یا Cursor IDE استفاده می‌کنند، معماری سرور Model Context Protocol (MCP) یک فیلتر اعتبارنامه بین توسعه‌دهنده و مدل هوش مصنوعی قرار می‌دهد.

سرور MCP هر متنی که از طریق جلسه عبور می‌کند را مدیریت می‌کند. کد paste‌شده، stack trace‌ها، فایل‌های پیکربندی، زمینه اشکال‌زدایی — همه آن‌ها قبل از اینکه مدل ببیند از یک مرحله ناشناسی‌سازی عبور می‌کنند.

موتور الگوهای اعتبارنامه را پیدا می‌کند: قالب‌های کلید API، رشته‌های پایگاه داده، توکن‌های OAuth، سرآیندهای کلید خصوصی و قالب‌های سفارشی که تیم امنیتی‌تان تعریف می‌کند. هر تطابق قبل از انتقال با یک توکن جایگزین می‌شود.

نحوه کار در عمل:

یک توسعه‌دهنده یک stack trace با یک رشته اتصال پایگاه داده paste می‌کند. سرور MCP رشته را با [DB_CONNECTION_1] جایگزین می‌کند. هوش مصنوعی trace را با توکن در جایش می‌بیند. کمک اشکال‌زدایی بر اساس نسخه ناشناس ارائه می‌دهد. اعتبارنامه واقعی هرگز شبکه داخلی را ترک نکرد.

این همان بردار نشتی را متوقف می‌کند که GitHub را با اسرار پر می‌کند. کانال متفاوت است — ابزارهای هوش مصنوعی، نه git commit‌ها — اما راه‌حل به همان شکل کار می‌کند: قبل از انتقال مسدود کنید.

برای نحوه مدیریت anonym.legal در ابزارهای هوش مصنوعی و گردش‌های کاری اسناد، مرور امنیتی ما را ببینید و برای کنترل‌های حسابرسی، مرکز انطباق را مراجعه کنید.

تشخیص پس از واقعه خیلی دیر است

بعضی تیم‌ها از اسکن پس از کامیت برای پیدا کردن اسرار نشت‌یافته استفاده می‌کنند. GitGuardian و truffleHog برای کانال GitHub به‌خوبی کار می‌کنند. جلسات ابزار هوش مصنوعی را پوشش نمی‌دهند.

وقتی یک راز به سرورهای ارائه‌دهنده هوش مصنوعی می‌رسد، افشا اتفاق افتاده است. اسکن آن را بعد پیدا می‌کند. ناشناسی‌سازی در لایه MCP مانع از رسیدن آن به مدل می‌شود.

۳۹ میلیون نشت GitHub یک کانال را مستند می‌کند. افشای ابزار هوش مصنوعی همان مشکل در کانالی با نظارت کمتر و بدون مسیر حسابرسی است. پیشگیری قبل از انتقال هر دو را پوشش می‌دهد.

منابع

آماده‌اید داده‌های خود را محافظت کنید؟

شروع به ناشناس‌سازی PII با بیش از ۲۸۵ نوع نهاد در ۴۸ زبان.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.