By · Last updated 2026-03-29

Voltar ao BlogSegurança de IA

39 Milhões de Vazamentos de Segredos no GitHub em...

67% dos desenvolvedores expuseram acidentalmente segredos no código (GitGuardian 2025).

March 29, 20268 min de leitura
GitHub secret leaksdeveloper AI securitycredential exposureMCP Server protectionGitGuardian 2025

39 milhões de credenciais vazadas em um ano

O relatório Octoverse 2024 do GitHub documentou 39 milhões de segredos vazados no GitHub em 2024. Isso representa um aumento de 25% em relação ao ano anterior 2023. Os segredos incluem chaves de API, strings de conexão, tokens de autenticação e credenciais de nuvem.

A causa é conhecida. Desenvolvedores fazem commits de código com segredos dentro. Os segredos vêm de sessões de depuração. Ou estão codificados diretamente em vez de armazenados em variáveis de ambiente. Com 39 milhões de vazamentos, isso não é raro. É rotineiro.

Ferramentas de IA criam um segundo canal de vazamento

A pesquisa da GitGuardian de 2025 revelou que 67% dos desenvolvedores expuseram acidentalmente segredos em código. Os mesmos hábitos que geram vazamentos no GitHub também geram vazamentos em ferramentas de IA.

Um desenvolvedor cola código no Claude, ChatGPT ou outro assistente de IA para pedir ajuda. Esse código frequentemente contém credenciais ativas. O modelo de IA recebe o segredo. Pode armazená-lo no histórico da conversa. Transmite-o para os servidores do provedor. O desenvolvedor perde o controle — sem nenhum aviso.

Três exemplos:

Depuração de banco de dados. Um desenvolvedor cola um stack trace. O trace inclui a string de conexão. O modelo de IA também lê a senha.

Revisão de pipeline. Um desenvolvedor compartilha um script de pipeline de dados. O script contém uma chave de acesso AWS e uma chave secreta. O modelo de IA recebe ambas.

Revisão de integração de API. Um desenvolvedor pede feedback sobre uma integração. O código inclui uma chave de API ativa de parceiro. A chave sai da rede do desenvolvedor.

Em cada caso, o objetivo é legítimo. O vazamento de credenciais é um efeito colateral de fornecer contexto suficiente ao modelo. É o mesmo padrão dos vazamentos no GitHub — sem intenção maliciosa, apenas por rotina.

Pipelines de CI/CD também estão expostos

Vazamentos de segredos em pipelines CI/CD aumentaram 34% em 2024. Scripts de build, configs de implantação e arquivos de infraestrutura como código passam agora por revisão com IA. Esses arquivos frequentemente contêm credenciais de nuvem e tokens de conta de serviço.

À medida que as ferramentas de IA cobrem mais do ciclo de desenvolvimento — revisão, documentação, depuração, otimização — a superfície de exposição cresce junto.

Arquitetura MCP bloqueia vazamentos

Para equipes que usam Claude Desktop ou Cursor IDE, a arquitetura de servidor MCP (Model Context Protocol) coloca um filtro de credenciais entre o desenvolvedor e o modelo de IA.

O servidor MCP processa todo texto que flui pela sessão. Código colado, stack traces, arquivos de configuração, contexto de depuração — tudo passa por uma etapa de anonimização antes de chegar ao modelo.

O mecanismo detecta padrões de credenciais: formatos de chaves de API, strings de conexão, tokens OAuth, cabeçalhos de chaves privadas e formatos personalizados definidos pela sua equipe de segurança. Cada correspondência é substituída por um token antes da transmissão.

O que isso significa na prática:

Um desenvolvedor cola um stack trace com uma string de conexão de banco de dados. O servidor MCP substitui a string por [DB_CONNECTION_1]. O modelo de IA vê o trace com o token no lugar. Fornece ajuda de depuração com base na versão anonimizada. As credenciais reais nunca saíram da rede interna.

Isso bloqueia o mesmo vetor de vazamento que enche o GitHub de segredos. O canal é diferente — ferramentas de IA em vez de commits git — mas a solução funciona da mesma forma: bloquear antes de transmitir.

Nossa visão geral de segurança explica como a anonym.legal aplica isso em ferramentas de IA e fluxos de trabalho de documentos. O centro de conformidade detalha os controles de auditoria.

Detecção após o fato chega tarde demais

Algumas equipes dependem de varredura pós-commit para detectar segredos vazados. GitGuardian e truffleHog funcionam bem para o canal do GitHub. Não cobrem sessões de ferramentas de IA.

Quando um segredo chega aos servidores de um provedor de IA, a exposição já ocorreu. A varredura encontra depois. A anonimização na camada MCP evita que chegue ao modelo.

Os 39 milhões de vazamentos no GitHub documentam um canal. A exposição via ferramentas de IA é o mesmo problema em um canal com menos monitoramento e sem trilha de auditoria. A prevenção antes da transmissão cobre os dois.

Fontes

Pronto para proteger seus dados?

Comece a anonimizar PII com mais de 285 tipos de entidades em 48 idiomas.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.