39 milhões de credenciais vazadas em um ano
O relatório Octoverse 2024 do GitHub documentou 39 milhões de segredos vazados no GitHub em 2024. Isso representa um aumento de 25% em relação ao ano anterior 2023. Os segredos incluem chaves de API, strings de conexão, tokens de autenticação e credenciais de nuvem.
A causa é conhecida. Desenvolvedores fazem commits de código com segredos dentro. Os segredos vêm de sessões de depuração. Ou estão codificados diretamente em vez de armazenados em variáveis de ambiente. Com 39 milhões de vazamentos, isso não é raro. É rotineiro.
Ferramentas de IA criam um segundo canal de vazamento
A pesquisa da GitGuardian de 2025 revelou que 67% dos desenvolvedores expuseram acidentalmente segredos em código. Os mesmos hábitos que geram vazamentos no GitHub também geram vazamentos em ferramentas de IA.
Um desenvolvedor cola código no Claude, ChatGPT ou outro assistente de IA para pedir ajuda. Esse código frequentemente contém credenciais ativas. O modelo de IA recebe o segredo. Pode armazená-lo no histórico da conversa. Transmite-o para os servidores do provedor. O desenvolvedor perde o controle — sem nenhum aviso.
Três exemplos:
Depuração de banco de dados. Um desenvolvedor cola um stack trace. O trace inclui a string de conexão. O modelo de IA também lê a senha.
Revisão de pipeline. Um desenvolvedor compartilha um script de pipeline de dados. O script contém uma chave de acesso AWS e uma chave secreta. O modelo de IA recebe ambas.
Revisão de integração de API. Um desenvolvedor pede feedback sobre uma integração. O código inclui uma chave de API ativa de parceiro. A chave sai da rede do desenvolvedor.
Em cada caso, o objetivo é legítimo. O vazamento de credenciais é um efeito colateral de fornecer contexto suficiente ao modelo. É o mesmo padrão dos vazamentos no GitHub — sem intenção maliciosa, apenas por rotina.
Pipelines de CI/CD também estão expostos
Vazamentos de segredos em pipelines CI/CD aumentaram 34% em 2024. Scripts de build, configs de implantação e arquivos de infraestrutura como código passam agora por revisão com IA. Esses arquivos frequentemente contêm credenciais de nuvem e tokens de conta de serviço.
À medida que as ferramentas de IA cobrem mais do ciclo de desenvolvimento — revisão, documentação, depuração, otimização — a superfície de exposição cresce junto.
Arquitetura MCP bloqueia vazamentos
Para equipes que usam Claude Desktop ou Cursor IDE, a arquitetura de servidor MCP (Model Context Protocol) coloca um filtro de credenciais entre o desenvolvedor e o modelo de IA.
O servidor MCP processa todo texto que flui pela sessão. Código colado, stack traces, arquivos de configuração, contexto de depuração — tudo passa por uma etapa de anonimização antes de chegar ao modelo.
O mecanismo detecta padrões de credenciais: formatos de chaves de API, strings de conexão, tokens OAuth, cabeçalhos de chaves privadas e formatos personalizados definidos pela sua equipe de segurança. Cada correspondência é substituída por um token antes da transmissão.
O que isso significa na prática:
Um desenvolvedor cola um stack trace com uma string de conexão de banco de dados. O servidor MCP substitui a string por [DB_CONNECTION_1]. O modelo de IA vê o trace com o token no lugar. Fornece ajuda de depuração com base na versão anonimizada. As credenciais reais nunca saíram da rede interna.
Isso bloqueia o mesmo vetor de vazamento que enche o GitHub de segredos. O canal é diferente — ferramentas de IA em vez de commits git — mas a solução funciona da mesma forma: bloquear antes de transmitir.
Nossa visão geral de segurança explica como a anonym.legal aplica isso em ferramentas de IA e fluxos de trabalho de documentos. O centro de conformidade detalha os controles de auditoria.
Detecção após o fato chega tarde demais
Algumas equipes dependem de varredura pós-commit para detectar segredos vazados. GitGuardian e truffleHog funcionam bem para o canal do GitHub. Não cobrem sessões de ferramentas de IA.
Quando um segredo chega aos servidores de um provedor de IA, a exposição já ocorreu. A varredura encontra depois. A anonimização na camada MCP evita que chegue ao modelo.
Os 39 milhões de vazamentos no GitHub documentam um canal. A exposição via ferramentas de IA é o mesmo problema em um canal com menos monitoramento e sem trilha de auditoria. A prevenção antes da transmissão cobre os dois.