anonym.legal

By · Last updated 2026-03-29

Назад на блоготБезбедност на вештачка интелигенција

39 милиони протекувања на GitHub: ризик на AI кодирање

67% од програмерите случајно изложиле тајни во код (GitGuardian 2025). 39 милиони тајни протекоа на GitHub во 2024 година, зголемување за 25% на годишно ниво.

March 29, 20268 мин читање
GitHub secret leaksdeveloper AI securitycredential exposureMCP Server protectionGitGuardian 2025

39 милиони ингеренции протекоа за една година

Извештајот GitHub Octoverse 2024 утврди 39 милиони тајни протекоа на GitHub во 2024 година. Тоа е зголемување за 25% на годишно ниво во споредба со 2023 година. Тајните вклучуваат API клучеви, стрингови на бази на податоци, токени за автентикација и облак ингеренции.

Причината е позната. Програмерите извршуваат commit на код со тајни внатре. Тајните доаѓаат од сесии за дебагирање. Или се хардкодирани наместо да се складираат во environment variables. При 39 милиони протекувања, ова не е реткост. Тоа е рутина.

AI алатките додаваат втор канал за протекување

Истражувањето на GitGuardian за 2025 година утврди дека 67% од програмерите случајно изложиле тајни во код. Истите навики кои создаваат протекувања на GitHub исто така создаваат протекувања преку AI алатки.

Програмер залепува код во Claude, ChatGPT или друг AI асистент за помош. Тој код често содржи живи ингеренции. AI моделот ја прима тајната. Може да ја зачува во историјата на разговорот. Ја испраќа до серверите на давателот. Програмерот ја губи контролата - без предупредување.

Три примери:

Дебагирање на база на податоци. Програмер залепува следење на стакот. Следењето го вклучува стрингот за поврзување. AI ја чита и лозинката.

Преглед на цевковод. Програмер споделува скрипта за цевковод на податоци. Скриптата има AWS клуч за пристап и тајни клуч. AI ги прима двата.

Преглед на API интеграција. Програмер бара повратни информации за интеграција. Кодот вклучува жив партнерски API клуч. Клучот ја напушта мрежата на програмерот.

Во секој случај, целта е легитимна помош. Протекувањето на ингеренцијата е несакана последица на давањето доволно контекст на AI. Ова е истиот образец како протекувањата на GitHub - не злонамерен, само рутински.

CI/CD цевководите се соочуваат со ист ризик

Протекувањата на тајни во CI/CD цевководите се зголемиле за 34% во 2024 година. Скриптите за изградба, конфигурациите за распоредување и датотеките за инфраструктура-како-код сега минуваат низ AI преглед. Овие датотеки често содржат облак ингеренции и токени за сметки на услуги.

Додека AI алатките покриваат се поголем дел од циклусот за развој - преглед, документација, дебагирање, оптимизација - просторот на изложеност расте заедно со нив.

Како архитектурата на MCP ги блокира протекувањата

За тимовите кои користат Claude Desktop или Cursor IDE, архитектурата на MCP сервер поставува филтер за ингеренции на патот помеѓу програмерот и AI моделот.

MCP серверот управува со секој текст кој се движи низ сесијата. Залепен код, следења на стакот, конфигурациски датотеки, контекст за дебагирање - сето тоа минува низ чекор на анонимизација пред моделот да го види.

Моторот наоѓа обрасци на ингеренции: формати на API клучеви, стрингови на бази на податоци, OAuth токени, заглавија на приватни клучеви и прилагодени формати кои ги дефинира вашиот безбедносен тим. Секое совпаѓање се заменува со токен пред пренос.

Како изгледа ова во пракса:

Програмер залепува следење на стакот со стринг за поврзување на база на податоци. MCP серверот го заменува стрингот со [DB_CONNECTION_1]. AI го гледа следењето со токенот на место. Дава помош за дебагирање врз основа на анонимизираната верзија. Вистинската ингеренција никогаш не ја напустила внатрешната мрежа.

Ова го запира истиот вектор на протекување кој ги полни GitHub со тајни. Каналот е различен - AI алатки, не git commit-и - но поправката функционира на ист начин: блокирај го пред да се пренесе.

Погледнете го нашиот преглед на безбедноста за тоа како anonym.legal го решава ова низ AI алатки и документациски работни текови, и центарот за усогласување за контроли на ревизорска трага.

Откривањето по факт е предоцна

Некои тимови користат скенирање по commit за да фатат протечени тајни. GitGuardian и truffleHog добро функционираат за каналот на GitHub. Тие не го покриваат сесиите на AI алатки.

Кога тајната ќе достигне до серверите на AI давателот, изложеноста е завршена. Скенирањето го наоѓа потоа. Анонимизацијата на слојот MCP ја спречува да достигне до моделот воопшто.

Протекувањата на 39 милиони на GitHub документираат еден канал. Изложеноста преку AI алатки е ист проблем во канал со помалку мониторинг и без ревизорска трага. Превенцијата пред пренос ги покрива двата.

Извори

Подготвени да ги заштитите вашите податоци?

Започнете со анонимизација на PII со 285+ типови на ентитети на 48 јазици.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.