By · Last updated 2026-03-29

Kembali ke BlogKeselamatan AI

39 Juta Kebocoran GitHub: Risiko Pengekodan AI

67% pembangun telah tersalah dedahkan rahsia dalam kod (GitGuardian 2025). 39 juta rahsia bocor di GitHub pada 2024, meningkat 25% berbanding tahun sebelumnya.

March 29, 20268 min baca
GitHub secret leaksdeveloper AI securitycredential exposureMCP Server protectionGitGuardian 2025

39 Juta Kelayakan Bocor dalam Satu Tahun

Laporan Octoverse 2024 GitHub mendapati 39 juta rahsia bocor di GitHub pada 2024. Itu adalah peningkatan 25% berbanding tahun sebelumnya dari 2023. Rahsia tersebut termasuk kunci API, rentetan pangkalan data, token pengesahan, dan kelayakan awan.

Sebabnya diketahui. Pembangun melakukan kod dengan rahsia di dalamnya. Rahsia berasal daripada sesi penyahpepijat. Atau ia dikodkan keras dan bukannya disimpan dalam pemboleh ubah persekitaran. Pada 39 juta kebocoran, ini bukan perkara luar biasa. Ia adalah rutin.

Alat AI Menambah Saluran Kebocoran Kedua

Penyelidikan GitGuardian 2025 mendapati bahawa 67% pembangun telah tersalah dedahkan rahsia dalam kod. Tabiat yang sama yang mencipta kebocoran GitHub juga mencipta kebocoran alat AI.

Seorang pembangun menampal kod ke dalam Claude, ChatGPT, atau pembantu AI lain untuk mendapatkan bantuan. Kod itu sering mempunyai kelayakan langsung di dalamnya. Model AI menerima rahsia itu. Ia mungkin menyimpannya dalam sejarah perbualan. Ia menghantar ke pelayan pembekal. Pembangun kehilangan kawalan -- tanpa sebarang amaran.

Tiga contoh:

Penyahpepijatan pangkalan data. Seorang pembangun menampal jejak tindanan. Jejak itu termasuk rentetan sambungan. AI membaca kata laluan juga.

Semakan saluran paip. Seorang pembangun berkongsi skrip saluran paip data. Skrip itu mempunyai kunci akses AWS dan kunci rahsia. AI menerima kedua-duanya.

Semakan integrasi API. Seorang pembangun meminta maklum balas mengenai integrasi. Kod tersebut termasuk kunci API rakan kongsi langsung. Kunci itu meninggalkan rangkaian pembangun.

Dalam setiap kes, matlamatnya adalah bantuan yang sah. Kebocoran kelayakan adalah kesan sampingan memberikan AI konteks yang mencukupi. Ini adalah corak yang sama seperti kebocoran GitHub -- bukan jahat, hanya rutin.

Saluran Paip CI/CD Menghadapi Risiko yang Sama

Kebocoran rahsia saluran paip CI/CD meningkat 34% pada 2024. Skrip binaan, konfigurasi penggunaan, dan fail infrastructure-as-code semuanya melalui semakan AI sekarang. Fail-fail ini sering mempunyai kelayakan awan dan token akaun perkhidmatan.

Apabila alat AI meliputi lebih banyak kitaran pembangun -- semakan, dokumentasi, penyahpepijatan, pengoptimuman -- permukaan pendedahan berkembang bersama mereka.

Cara Seni Bina MCP Menghalang Kebocoran

Bagi pasukan yang menggunakan Claude Desktop atau Cursor IDE, seni bina pelayan Model Context Protocol (MCP) meletakkan penapis kelayakan dalam laluan antara pembangun dan model AI.

Pelayan MCP mengendalikan setiap teks yang bergerak melalui sesi itu. Kod yang ditampal, jejak tindanan, fail konfigurasi, konteks penyahpepijatan -- semuanya melalui langkah penganonan sebelum model melihatnya.

Enjin itu menemui corak kelayakan: format kunci API, rentetan pangkalan data, token OAuth, pengepala kunci peribadi, dan format tersuai yang ditentukan oleh pasukan keselamatan anda. Setiap padanan digantikan dengan token sebelum penghantaran.

Begini rupanya dalam amalan:

Seorang pembangun menampal jejak tindanan dengan rentetan sambungan pangkalan data. Pelayan MCP menggantikan rentetan dengan [DB_CONNECTION_1]. AI melihat jejak dengan token di tempatnya. Ia memberikan bantuan penyahpepijatan berdasarkan versi yang dianonkan. Kelayakan sebenar tidak pernah meninggalkan rangkaian dalaman.

Ini menghalang vektor kebocoran yang sama yang memenuhi GitHub dengan rahsia. Salurannya berbeza -- alat AI, bukan komit git -- tetapi pembetulannya berfungsi dengan cara yang sama: halang sebelum ia dihantar.

Lihat gambaran keseluruhan keselamatan kami untuk cara anonym.legal mengendalikan ini merentasi alat AI dan aliran kerja dokumen, dan pusat pematuhan untuk kawalan audit.

Pengesanan Selepas Kejadian Terlambat

Sesetengah pasukan menggunakan pengimbasan pasca-komit untuk menangkap rahsia yang bocor. GitGuardian dan truffleHog berfungsi dengan baik untuk saluran GitHub. Mereka tidak meliputi sesi alat AI.

Apabila rahsia sampai ke pelayan pembekal AI, pendedahan telah berlaku. Pengimbasan menemuinya selepas itu. Penganonan lapisan MCP menghalangnya daripada sampai ke model langsung.

39 juta kebocoran GitHub mendokumentasikan satu saluran. Pendedahan alat AI adalah masalah yang sama dalam saluran dengan pemantauan yang lebih sedikit dan tiada jejak audit. Pencegahan sebelum penghantaran meliputi kedua-duanya.

Sumber

Sedia untuk melindungi data anda?

Mulakan pengenalan PII dengan 285+ jenis entiti dalam 48 bahasa.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.