By · Last updated 2026-03-29

بلاگ پر واپس جائیںAI سیکیورٹی

GitHub پر 39 ملین لیکس: AI کوڈنگ کا خطرہ

67% ڈویلپرز نے غلطی سے کوڈ میں خفیہ معلومات ظاہر کی ہیں (GitGuardian 2025)۔ 2024 میں GitHub پر 39 ملین خفیہ معلومات لیک ہوئیں، سال بہ سال 25% اضافہ۔

March 29, 20268 منٹ پڑھیں
GitHub secret leaksdeveloper AI securitycredential exposureMCP Server protectionGitGuardian 2025

ایک سال میں 39 ملین اسناد لیک

GitHub کی Octoverse 2024 رپورٹ نے پایا کہ 2024 میں GitHub پر 39 ملین خفیہ معلومات لیک ہوئیں۔ یہ 2023 سے 25% سال بہ سال اضافہ ہے۔ خفیہ معلومات میں API keys، ڈیٹا بیس strings، auth tokens، اور cloud اسناد شامل ہیں۔

وجہ معلوم ہے۔ ڈویلپرز اندر خفیہ معلومات کے ساتھ کوڈ commit کرتے ہیں۔ خفیہ معلومات debug سیشنز سے آتی ہیں۔ یا انہیں environment variables میں محفوظ کرنے کی بجائے hardcode کیا جاتا ہے۔ 39 ملین لیکس کے ساتھ، یہ غیر معمولی نہیں ہے۔ یہ معمول ہے۔

AI ٹولز ایک دوسرا لیک چینل شامل کرتے ہیں

GitGuardian کی 2025 کی تحقیق نے پایا کہ 67% ڈویلپرز نے غلطی سے کوڈ میں خفیہ معلومات ظاہر کی ہیں۔ وہی عادات جو GitHub لیکس پیدا کرتی ہیں AI ٹول لیکس بھی پیدا کرتی ہیں۔

ایک ڈویلپر مدد کے لیے Claude، ChatGPT، یا کسی اور AI اسسٹنٹ میں کوڈ paste کرتا ہے۔ اس کوڈ میں اکثر لائیو اسناد ہوتی ہیں۔ AI ماڈل خفیہ معلومات وصول کرتا ہے۔ یہ انہیں conversation history میں محفوظ کر سکتا ہے۔ یہ انہیں provider کے سرورز کو بھیجتا ہے۔ ڈویلپر کنٹرول کھو دیتا ہے — بغیر کسی انتباہ کے۔

تین مثالیں:

ڈیٹا بیس debugging۔ ایک ڈویلپر stack trace paste کرتا ہے۔ trace میں connection string شامل ہے۔ AI پاس ورڈ بھی پڑھتا ہے۔

Pipeline جائزہ۔ ایک ڈویلپر ڈیٹا pipeline script شیئر کرتا ہے۔ script میں AWS access key اور secret key ہے۔ AI دونوں وصول کرتا ہے۔

API integration جائزہ۔ ایک ڈویلپر integration پر فیڈ بیک مانگتا ہے۔ کوڈ میں ایک لائیو partner API key ہے۔ یہ key ڈویلپر کے نیٹ ورک سے باہر چلی جاتی ہے۔

ہر معاملے میں، مقصد جائز مدد ہے۔ اسناد کا لیک AI کو کافی سیاق و سباق دینے کا ضمنی اثر ہے۔ یہ GitHub لیکس جیسا ہی نمونہ ہے — بدنیتی پر مبنی نہیں، بس معمول۔

CI/CD Pipelines کو بھی یہی خطرہ ہے

CI/CD pipeline کی خفیہ لیکس 2024 میں 34% بڑھیں۔ Build scripts، deployment configs، اور infrastructure-as-code فائلیں اب AI جائزے سے گزرتی ہیں۔ ان فائلوں میں اکثر cloud اسناد اور service account tokens ہوتے ہیں۔

جیسے جیسے AI ٹولز dev cycle کا زیادہ حصہ سنبھالتے ہیں — جائزہ، docs، debugging، optimization — exposure کی سطح ان کے ساتھ بڑھتی ہے۔

MCP آرکیٹیکچر لیکس کو کیسے روکتا ہے

Claude Desktop یا Cursor IDE استعمال کرنے والی ٹیموں کے لیے، Model Context Protocol (MCP) سرور آرکیٹیکچر ڈویلپر اور AI ماڈل کے درمیان راستے میں ایک credential فلٹر رکھتا ہے۔

MCP سرور سیشن میں گزرنے والے ہر متن کو سنبھالتا ہے۔ Pasted کوڈ، stack traces، config فائلیں، debug context — یہ سب ماڈل کے دیکھنے سے پہلے익명화 مرحلے سے گزرتا ہے۔

انجن credential پیٹرن تلاش کرتا ہے: API key فارمیٹس، ڈیٹا بیس strings، OAuth tokens، private key headers، اور آپ کی سیکیورٹی ٹیم کے مقررہ کسٹم فارمیٹس۔ ہر میچ ٹرانسمیشن سے پہلے ٹوکن سے بدل دیا جاتا ہے۔

عملی طور پر یہ کیسا لگتا ہے:

ایک ڈویلپر ڈیٹا بیس connection string کے ساتھ stack trace paste کرتا ہے۔ MCP سرور string کو [DB_CONNECTION_1] سے بدلتا ہے۔ AI ٹوکن کی جگہ کے ساتھ trace دیکھتا ہے۔ یہ익명화 شدہ ورژن کی بنیاد پر debugging مدد فراہم کرتا ہے۔ اصل credential کبھی داخلی نیٹ ورک نہیں چھوڑی۔

یہ وہی لیک vector کو روکتا ہے جو GitHub کو خفیہ معلومات سے بھر دیتا ہے۔ چینل مختلف ہے — AI ٹولز، git commits نہیں — لیکن حل ایک جیسے طریقے سے کام کرتا ہے: ٹرانسمٹ ہونے سے پہلے روکیں۔

anonym.legal AI ٹولز اور دستاویز workflows میں یہ کیسے سنبھالتا ہے اس کے لیے ہمارا سیکیورٹی جائزہ دیکھیں، اور آڈٹ کنٹرولز کے لیے تعمیل مرکز دیکھیں۔

حقیقت کے بعد ڈیٹیکشن بہت دیر سے ہے

کچھ ٹیمیں لیک ہوئی خفیہ معلومات پکڑنے کے لیے post-commit scanning استعمال کرتی ہیں۔ GitGuardian اور truffleHog GitHub چینل کے لیے اچھی طرح کام کرتے ہیں۔ یہ AI ٹول سیشنز کا احاطہ نہیں کرتے۔

جب ایک خفیہ معلومات AI provider کے سرورز تک پہنچتی ہے، exposure ہو چکا ہے۔ Scanning بعد میں اسے تلاش کرتی ہے۔ MCP-layer익명화 اسے ماڈل تک پہنچنے سے پہلے روکتی ہے۔

39 ملین GitHub لیکس ایک چینل دستاویز کرتی ہیں۔ AI ٹول exposure ایک ایسے چینل میں ایک جیسا مسئلہ ہے جس میں کم نگرانی اور کوئی audit trail نہیں۔ ٹرانسمیشن سے پہلے روک تھام دونوں کا احاطہ کرتی ہے۔

ماخذ

کیا آپ اپنے ڈیٹا کی حفاظت کے لیے تیار ہیں؟

48 زبانوں میں 285+ ادارتی اقسام کے ساتھ PII کی گمنامی شروع کریں۔

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.