anonym.legal

By · Last updated 2026-03-29

Назад към блогаСигурност на AI

39 млн. изтичания от GitHub: Риск от AI кодиране

67% от разработчиците са изложили случайно тайни в код (GitGuardian 2025). 39 милиона тайни са изтекли в GitHub през 2024 г., ръст от 25% на годишна база.

March 29, 20268 мин. четене
GitHub secret leaksdeveloper AI securitycredential exposureMCP Server protectionGitGuardian 2025

39 милиона изтекли идентификационни данни за една година

Докладът на GitHub Octoverse 2024 установи 39 милиона изтекли тайни в GitHub през 2024 г. Това е 25% ръст на годишна база спрямо 2023 г. Тайните включват API ключове, низове за бази данни, токени за удостоверяване и облачни идентификационни данни.

Причината е известна. Разработчиците записват код с тайни в него. Тайните идват от сесии за отстраняване на грешки. Или са твърдо кодирани вместо съхранени в променливи на средата. При 39 милиона изтичания, това не е рядкост. Това е рутина.

AI инструментите добавят втори канал за изтичане

Изследването на GitGuardian от 2025 г. установи, че 67% от разработчиците са случайно изложили тайни в код. Същите навици, които създават изтичания в GitHub, създават и изтичания в AI инструменти.

Разработчик поставя код в Claude, ChatGPT или друг AI асистент за помощ. Този код често съдържа живи идентификационни данни. AI моделът получава тайната. Може да я съхрани в историята на разговора. Изпраща я до сървърите на доставчика. Разработчикът губи контрол - без предупреждение.

Три примера:

Отстраняване на грешки в база данни. Разработчик поставя проследяване на стека. Проследяването включва низа за свързване. AI чете паролата също.

Преглед на тръбопровода. Разработчик споделя скрипт за тръбопровод за данни. Скриптът съдържа ключ за достъп до AWS и таен ключ. AI получава и двата.

Преглед на интеграция с API. Разработчик иска обратна връзка за интеграция. Кодът включва жив API ключ на партньор. Ключът напуска мрежата на разработчика.

Във всеки случай целта е законна помощ. Изтичането на идентификационни данни е страничен ефект от предоставянето на достатъчно контекст на AI. Това е същият модел като изтичанията в GitHub - не злонамерен, а просто рутинен.

CI/CD тръбопроводите са изправени пред същия риск

Изтичанията на тайни от CI/CD тръбопровод нарастнаха с 34% през 2024 г. Скриптовете за изграждане, конфигурациите за внедряване и файловете infrastructure-as-code вече минават през AI преглед. Тези файлове често съдържат облачни идентификационни данни и токени за служебни акаунти.

Тъй като AI инструментите обхващат все повече от цикъла на разработка - преглед, документация, отстраняване на грешки, оптимизация - повърхността на излагане нараства заедно с тях.

Как MCP архитектурата блокира изтичанията

За екипи, използващи Claude Desktop или Cursor IDE, архитектурата на MCP сървър (Model Context Protocol) поставя филтър за идентификационни данни по пътя между разработчика и AI модела.

MCP сървърът обработва всеки текст, преминаващ през сесията. Поставен код, проследявания на стека, конфигурационни файлове, контекст за отстраняване на грешки - всичко минава през стъпка за анонимизация преди моделът да го види.

Двигателят открива шаблони на идентификационни данни: формати на API ключове, низове за бази данни, OAuth токени, заглавки на частни ключове и персонализирани формати, определени от вашия екип по сигурността. Всяко съвпадение се заменя с токен преди предаването.

Как изглежда това на практика:

Разработчик поставя проследяване на стека с низ за свързване на база данни. MCP сървърът заменя низа с [DB_CONNECTION_1]. AI вижда проследяването с токена на негово място. Той дава помощ при отстраняване на грешки въз основа на анонимизираната версия. Действителните идентификационни данни никога не са напускали вътрешната мрежа.

Това спира същия вектор на изтичане, който запълва GitHub с тайни. Каналът е различен - AI инструменти, а не git записи - но поправката работи по същия начин: блокирай го преди да се предаде.

Вижте нашия преглед на сигурността за това как anonym.legal се справя с това при AI инструменти и работни процеси с документи, и центъра за съответствие за контроли на одитна пътека.

Засичането след факта е твърде късно

Някои екипи използват сканиране след записване, за да уловят изтеклите тайни. GitGuardian и truffleHog работят добре за канала на GitHub. Те не покриват сесиите с AI инструменти.

Когато тайна достигне сървърите на AI доставчик, излагането е свършен факт. Сканирането го открива след това. Анонимизацията на слоя MCP я спира да достигне модела изобщо.

39-те милиона изтичания в GitHub документират един канал. Излагането чрез AI инструменти е същият проблем в канал с по-малко наблюдение и без одитна пътека. Предотвратяването преди предаването покрива и двата.

Източници

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.