By · Last updated 2026-03-29

Powrót do blogaBezpieczeństwo AI

39 mln wycieków z GitHub: ryzyko kodowania z AI

67% programistów przypadkowo ujawniło sekrety w kodzie (GitGuardian 2025). W 2024 r. na GitHubie wyciekło 39 milionów sekretów — wzrost o 25% rok do roku.

March 29, 20268 min czytania
GitHub secret leaksdeveloper AI securitycredential exposureMCP Server protectionGitGuardian 2025

39 milionów danych uwierzytelniających wyciekło w ciągu roku

Raport GitHub Octoverse 2024 odnotował 39 milionów wyciekłych sekretów na GitHubie w 2024 r. To wzrost o 25% rok do roku względem 2023 r. Wśród sekretów znalazły się klucze API, ciągi połączeń z bazami danych, tokeny uwierzytelniające i dane uwierzytelniające do chmury.

Przyczyna jest znana. Programiści umieszczają kod z sekretami w commitach. Sekrety pochodzą z sesji debugowania lub są zakodowane na stałe zamiast przechowywane w zmiennych środowiskowych. Przy 39 milionach wycieków to nie jest rzadkość — to rutyna.

Narzędzia AI dodają drugi kanał wycieku

Badania GitGuardian z 2025 r. wykazały, że 67% programistów przypadkowo ujawniło sekrety w kodzie. Te same nawyki, które tworzą wycieki na GitHubie, tworzą też wycieki przez narzędzia AI.

Programista wkleja kod do Claude, ChatGPT lub innego asystenta AI, szukając pomocy. Ten kod często zawiera aktywne dane uwierzytelniające. Model AI otrzymuje sekret, może go przechowywać w historii rozmowy, wysyła go na serwery dostawcy. Programista traci kontrolę — bez żadnego ostrzeżenia.

Trzy przykłady:

Debugowanie bazy danych. Programista wkleja ślad stosu. Ślad zawiera ciąg połączenia. AI odczytuje też hasło.

Przegląd potoku danych. Programista udostępnia skrypt potoku danych. Skrypt zawiera klucz dostępu AWS i klucz tajny. AI otrzymuje oba.

Przegląd integracji API. Programista prosi o opinię na temat integracji. Kod zawiera aktywny klucz API partnera. Klucz opuszcza sieć programisty.

W każdym przypadku cel jest uzasadniony. Wyciek danych uwierzytelniających jest efektem ubocznym przekazania AI wystarczającego kontekstu. To ten sam wzorzec co wycieki na GitHubie — nie złośliwy, po prostu rutynowy.

Potoki CI/CD mierzą się z tym samym ryzykiem

Wycieki sekretów z potoków CI/CD wzrosły o 34% w 2024 r. Skrypty budowania, konfiguracje wdrożeń i pliki infrastruktury jako kodu — wszystkie przechodzą teraz przez przegląd AI. Te pliki często zawierają dane uwierzytelniające do chmury i tokeny kont usług.

W miarę jak narzędzia AI obejmują coraz więcej cyklu deweloperskiego — przegląd, dokumentacja, debugowanie, optymalizacja — powierzchnia ekspozycji rośnie wraz z nimi.

Jak architektura MCP blokuje wycieki

Dla zespołów korzystających z Claude Desktop lub Cursor IDE architektura serwera Model Context Protocol (MCP) umieszcza filtr danych uwierzytelniających na ścieżce między programistą a modelem AI.

Serwer MCP obsługuje każdy tekst przepływający przez sesję. Wklejony kod, ślady stosu, pliki konfiguracyjne, kontekst debugowania — wszystko przechodzi przez krok anonimizacji, zanim model to zobaczy.

Silnik wykrywa wzorce danych uwierzytelniających: formaty kluczy API, ciągi baz danych, tokeny OAuth, nagłówki kluczy prywatnych i własne formaty zdefiniowane przez zespół bezpieczeństwa. Każde trafienie jest zastępowane tokenem przed transmisją.

Jak to wygląda w praktyce:

Programista wkleja ślad stosu zawierający ciąg połączenia z bazą danych. Serwer MCP zastępuje ciąg przez [DB_CONNECTION_1]. AI widzi ślad z tokenem na właściwym miejscu. Udziela pomocy w debugowaniu na podstawie zanonimizowanej wersji. Rzeczywiste dane uwierzytelniające nigdy nie opuściły sieci wewnętrznej.

To zatrzymuje ten sam wektor wycieku, który zapełnia GitHub sekretami. Kanał jest inny — narzędzia AI zamiast commitów git — ale rozwiązanie działa tak samo: zablokuj przed transmisją.

Zobacz nasz przegląd bezpieczeństwa, aby dowiedzieć się, jak anonym.legal obsługuje to w narzędziach AI i przepływach pracy z dokumentami, oraz centrum zgodności dla kontroli audytu.

Wykrycie po fakcie jest za późne

Niektóre zespoły używają skanowania po commicie do wychwytywania wyciekłych sekretów. GitGuardian i truffleHog dobrze działają dla kanału GitHub. Nie obejmują sesji z narzędziami AI.

Gdy sekret dotrze na serwery dostawcy AI, ekspozycja jest już dokonana. Skanowanie ją wykrywa po fakcie. Anonimizacja na poziomie MCP zatrzymuje sekret, zanim w ogóle dotrze do modelu.

39 milionów wycieków z GitHub dokumentuje jeden kanał. Ekspozycja przez narzędzia AI to ten sam problem w kanale z mniejszym monitoringiem i bez ścieżki audytu. Zapobieganie przed transmisją obejmuje oba.

Źródła

Gotowy, aby chronić swoje dane?

Rozpocznij anonimizację PII z 285+ typami podmiotów w 48 językach.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.