39 millioner legitimasjonsdatalekkasjer pa ett ar
GitHubs Octoverse 2024-rapport fant 39 millioner lekkede hemmeligheter pa GitHub i 2024. Det er en 25 % okning ar over ar fra 2023. Hemmelighetene inkluderer API-nokler, databasestrenger, autentiseringstokens og skyakkreditiver.
Arsaken er kjent. Utviklere committer kode med hemmeligheter inni. Hemmelighetene kommer fra feilsokingssokter. Eller de hardkodes i stedet for a lagres i miljovariabler. Med 39 millioner lekkasjer er dette ikke uvanlig. Det er rutine.
AI-verktoy legger til en andre lekkasjekanal
GitGuardians forskning fra 2025 fant at 67 % av utviklere ved et uhell har eksponert hemmeligheter i kode. De samme vanene som skaper GitHub-lekkasjer skaper ogsa lekkasjer via AI-verktoy.
En utvikler limer inn kode i Claude, ChatGPT eller en annen AI-assistent for hjelp. Den koden inneholder ofte live-legitimasjonsdataer. AI-modellen mottar hemmeligheten. Den kan lagre den i samtalehistorikken. Den sender den til leverandorens servere. Utvikleren mister kontrollen - uten varsel.
Tre eksempler:
Databasefeilsoking. En utvikler limer inn en stakksporing. Sporingen inkluderer tilkoblingsstrengen. AI-en leser ogsa passordet.
Pipeline-gjennomgang. En utvikler deler et datapipeline-skript. Skriptet har en AWS-tilgangsnokkel og hemmelig nokkel. AI-en mottar begge.
API-integrasjonsgjennomgang. En utvikler ber om tilbakemelding pa en integrasjon. Koden inkluderer en live partner-API-nokkel. Nokkelen forlater utviklerens nettverk.
I hvert tilfelle er malet legitim hjelp. Legitimasjonsdatalekkasjen er en bivirkning av a gi AI-en nok kontekst. Dette er det samme monsteret som GitHub-lekkasjer - ikke ondsinnet, bare rutine.
CI/CD-pipelines star overfor den samme risikoen
Hemmelighetslekkasjer i CI/CD-pipelines okte med 34 % i 2024. Byggeskripter, distribusjonskonfigurasjoner og infrastruktur-som-kode-filer gjennomgas alle av AI na. Disse filene inneholder ofte skyakkreditiver og tjenestekontotoken.
Etter hvert som AI-verktoy dekker mer av utviklingssyklusen - gjennomgang, dokumentasjon, feilsoking, optimalisering - vokser eksponeringsflaten med dem.
Hvordan MCP-arkitektur blokkerer lekkasjer
For team som bruker Claude Desktop eller Cursor IDE legger Model Context Protocol (MCP) server-arkitektur et legitimasjonsfilter i veien mellom utvikler og AI-modell.
MCP-serveren handterer all tekst som flyttes gjennom okten. Limt inn kode, stakkspor, konfigurasjonsfiler, feilsokingskontekst - alt det passerer gjennom et anonymiseringstrinn for modellen ser det.
Motoren finner legitimasjonsmonster: API-nokkelformater, databasestrenger, OAuth-tokens, private nokkelhoveder og egendefinerte formater sikkerhetsteamet ditt definerer. Hvert treff erstattes med et token for overoring.
Slik ser det ut i praksis:
En utvikler limer inn en stakksporing med en databasetilkoblingsstreng. MCP-serveren erstatter strengen med [DB_CONNECTION_1]. AI-en ser sporingen med tokenet pa plass. Den gir feilsokingshjelp basert pa den anonymiserte versjonen. Den faktiske legitimasjonsdataen forlot aldri det interne nettverket.
Dette stopper den samme lekkasjevektoren som fyller GitHub med hemmeligheter. Kanalen er annerledes - AI-verktoy, ikke git-commits - men losningen fungerer pa samme mate: blokker det for det overores.
Se var sikkerhetsoversikte for hvordan anonym.legal handterer dette pa tvers av AI-verktoy og dokumentarbeidsflyter, og samsvarssenteret for revisjonskontroller.
Deteksjon i etterkant er for sent
Noen team bruker post-commit-skanning for a fange lekkede hemmeligheter. GitGuardian og truffleHog fungerer godt for GitHub-kanalen. De dekker ikke AI-verktoyokter.
Nar en hemmelighet nar en AI-leverandors servere, er eksponeringen gjort. Skanning finner det i ettertid. MCP-lags anonymisering hindrer det i a na modellen i det hele tatt.
De 39 millioner GitHub-lekkasjene dokumenterer en kanal. AI-verktoyeksponering er det samme problemet i en kanal med mindre overvakning og ingen revisjonslogg. Forebygging for overoring dekker begge.