By · Last updated 2026-03-29

Tagasi BlogisseAI Turvalisus

39 miljonit GitHub leket: tehisintellekti kodeerimise risk

67% arendajatest on kogemata koodi kaudu saladusi paljastanud (GitGuardian 2025). 2024. aastal lekitati GitHubis 39 miljonit saladust – 25% rohkem kui eelmisel aastal.

March 29, 20268 min lugemist
GitHub secret leaksdeveloper AI securitycredential exposureMCP Server protectionGitGuardian 2025

39 miljonit mandaati lekitati ühe aastaga

GitHubi Octoverse 2024 aruanne leidis, et 2024. aastal lekitati GitHubis 39 miljonit saladust. See on 25% aastane kasv 2023. aastast. Saladuste hulka kuuluvad API-võtmed, andmebaasi ühendusstring, autentimisleksemid ja pilvekredensiaalid.

Põhjus on teada. Arendajad kommitatavad koodi, milles on saladused. Saladused pärinevad silumisseanssidest. Või need hardkodeeritakse keskkonna muutujate asemel. 39 miljoni leke puhul ei ole see harv. See on rutiinne.

Tehisintellekti tööriistad lisavad teise lekkekanali

GitGuardiani 2025 uuring leidis, et 67% arendajatest on kogemata koodi kaudu saladusi paljastanud. Samad harjumused, mis tekitavad GitHubi lekked, tekitavad ka tehisintellekti tööriistade lekked.

Arendaja kleebib koodi Claude'i, ChatGPT-sse või mõnda muusse tehisintellekti assistenti abi saamiseks. Sellel koodil on sageli sees elusad kredensiaalid. Tehisintellekti mudel saab saladuse. See võib salvestada selle vestlusajalukku. See saadab selle teenusepakkuja serveritesse. Arendaja kaotab kontrolli – ilma hoiatuseta.

Kolm näidet:

Andmebaasi silumine. Arendaja kleebib virna jälje. Jälg sisaldab ühendusstring. Tehisintellekt loeb ka parooli.

Torustiku ülevaade. Arendaja jagab andmete torustiku skripti. Skriptis on AWS-i juurdepääsuvõti ja salajane võti. Tehisintellekt saab mõlemad.

API integratsiooni ülevaade. Arendaja palub tagasisidet integratsiooni kohta. Kood sisaldab elusa partneri API-võtit. Võti lahkub arendaja võrgust.

Igal juhul on eesmärk õigustatud abi. Mandaatide leke on kõrvalefekt, mis tuleneb tehisintellektile piisava konteksti andmisest. See on sama muster kui GitHubi lekked – mitte pahatahtlik, lihtsalt rutiinne.

CI/CD torustikud seisavad silmitsi sama riskiga

CI/CD torustiku saladuste lekked kasvasid 2024. aastal 34%. Ehitusskripte, juurutuse konfiguratsioone ja infrastruktuuri-kui-koodi faile vaadatakse nüüd tehisintellektiga üle. Need failid sisaldavad sageli pilvekredensiaalid ja teenusekonto leksemid.

Kuna tehisintellekti tööriistad katavad üha rohkem arendusetsüklit – ülevaade, dokumentatsioon, silumine, optimeerimine – kasvab kokkupuute pind koos nendega.

Kuidas MCP-arhitektuur lekked blokeerib

Claude Desktopi või Cursor IDE-d kasutavatele meeskondadele paneb Model Context Protocol (MCP) serveri arhitektuur mandaatide filtri arendaja ja tehisintellekti mudeli vahele.

MCP-server käsitleb kogu teksti, mis liigub läbi seansi. Kleebitud kood, virna jäljed, konfiguratsioonifailid, silumise kontekst – kõik see läbib anonümiseerimise etapi enne mudeli nägemist.

Mootor leiab mandaatide mustrid: API-võtme vormingud, andmebaasi stringid, OAuth leksemid, privaatvõtme päised ja kohandatud vormingud, mille teie turbetiim määratleb. Iga vaste asendatakse leksemiga enne edastamist.

Mis see praktikas välja näeb:

Arendaja kleebib virna jälje andmebaasi ühendusstring. MCP-server asendab stringi [DB_CONNECTION_1]-ga. Tehisintellekt näeb jälge koos leksemiga. See annab silumisabi anonümiseeritud versiooni põhjal. Tegelik mandaat ei lahkunud sisevõrgust.

See peatab sama lekke vektori, mis täidab GitHubi saladuste lekkedega. Kanal on erinev – tehisintellekti tööriistad, mitte giti kommitatavad – kuid lahendus toimib samal viisil: blokeeri enne edastamist.

Vaadake meie turbe ülevaadet selle kohta, kuidas anonym.legal seda käsitleb tehisintellekti tööriistade ja dokumentide töövoogude lõikes, ning vastavuskeskust auditi kontrollide kohta.

Tagantjärele tuvastamine on liiga hilja

Mõned meeskonnad kasutavad pärast kommiti skaneerimist lekkinud saladuste leidmiseks. GitGuardian ja truffleHog töötavad hästi GitHubi kanali jaoks. Need ei kata tehisintellekti tööriistade seansse.

Kui saladus jõuab tehisintellekti teenusepakkuja serveritesse, on kokkupuude toimunud. Skaneerimine leiab selle hiljem. MCP-kihi anonümiseerimine takistab selle jõudmist mudelini.

39 miljonit GitHubi leket dokumenteerib ühe kanali. Tehisintellekti tööriistade kokkupuude on sama probleem kanalis, millel on vähem jälgimist ja auditijälge. Ennetamine enne edastamist katab mõlemad.

Allikad

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.