By · Last updated 2026-03-29

Volver al BlogSeguridad de IA

39 Millones de Filtraciones de Secretos en GitHub en...

El 67% de los desarrolladores ha expuesto accidentalmente secretos en el código (GitGuardian 2025).

March 29, 20268 min de lectura
GitHub secret leaksdeveloper AI securitycredential exposureMCP Server protectionGitGuardian 2025

39 millones de credenciales filtradas en un año

El informe Octoverse 2024 de GitHub documentó 39 millones de secretos filtrados en GitHub durante 2024. Eso es un aumento del 25 % respecto al año anterior 2023. Los secretos incluyen claves API, cadenas de conexión, tokens de autenticación y credenciales en la nube.

La causa es conocida. Los desarrolladores hacen commits de código con secretos dentro. Los secretos vienen de sesiones de depuración. O están codificados de forma fija en lugar de almacenarse en variables de entorno. Con 39 millones de filtraciones, esto no es raro. Es rutinario.

Las herramientas de IA crean un segundo canal de fuga

La investigación de GitGuardian de 2025 encontró que el 67 % de los desarrolladores han expuesto accidentalmente secretos en código. Los mismos hábitos que generan filtraciones en GitHub también generan filtraciones en herramientas de IA.

Un desarrollador pega código en Claude, ChatGPT u otro asistente de IA para pedir ayuda. Ese código suele contener credenciales activas. El modelo de IA recibe el secreto. Puede almacenarlo en el historial de conversación. Lo transmite a los servidores del proveedor. El desarrollador pierde el control, sin ninguna advertencia.

Tres ejemplos:

Depuración de base de datos. Un desarrollador pega un stack trace. El trace incluye la cadena de conexión. El modelo de IA también lee la contraseña.

Revisión de pipeline. Un desarrollador comparte un script de pipeline de datos. El script contiene una clave de acceso de AWS y una clave secreta. El modelo de IA recibe ambas.

Revisión de integración API. Un desarrollador pide retroalimentación sobre una integración. El código incluye una clave API activa de un partner. La clave sale de la red del desarrollador.

En cada caso, el propósito es legítimo. La filtración de credenciales es un efecto secundario de dar suficiente contexto al modelo. Es el mismo patrón que las filtraciones en GitHub — sin intención maliciosa, solo por rutina.

Los pipelines de CI/CD también están expuestos

Las filtraciones de secretos en pipelines CI/CD aumentaron un 34 % en 2024. Los scripts de build, las configs de despliegue y los archivos de infraestructura como código ahora pasan todos por revisión con IA. Estos archivos suelen contener credenciales en la nube y tokens de cuenta de servicio.

A medida que las herramientas de IA cubren más del ciclo de desarrollo — revisión, documentación, depuración, optimización — la superficie de exposición crece con ellas.

La arquitectura MCP bloquea las fugas

Para equipos que usan Claude Desktop o Cursor IDE, la arquitectura de servidor MCP (Model Context Protocol) coloca un filtro de credenciales entre el desarrollador y el modelo de IA.

El servidor MCP maneja todo el texto que fluye por la sesión. Código pegado, stack traces, archivos de configuración, contexto de depuración — todo pasa por un paso de anonimización antes de que el modelo lo vea.

El motor detecta patrones de credenciales: formatos de claves API, cadenas de conexión, tokens OAuth, encabezados de claves privadas y formatos personalizados que define su equipo de seguridad. Cada coincidencia se reemplaza con un token antes de la transmisión.

Lo que esto significa en la práctica:

Un desarrollador pega un stack trace con una cadena de conexión a una base de datos. El servidor MCP reemplaza la cadena por [DB_CONNECTION_1]. El modelo de IA ve el trace con el token en su lugar. Proporciona ayuda de depuración basada en la versión anonimizada. Las credenciales reales nunca salieron de la red interna.

Esto detiene el mismo vector de fuga que llena GitHub de secretos. El canal es diferente — herramientas de IA en lugar de commits git — pero la solución funciona igual: bloquear antes de transmitir.

Nuestra descripción de seguridad explica cómo anonym.legal aplica esto en herramientas de IA y flujos de trabajo documentales. El centro de cumplimiento cubre los controles de auditoría.

La detección a posteriori llega demasiado tarde

Algunos equipos utilizan el análisis post-commit para detectar secretos filtrados. GitGuardian y truffleHog funcionan bien para el canal de GitHub. No cubren las sesiones de herramientas de IA.

Cuando un secreto llega a los servidores de un proveedor de IA, la exposición ya ocurrió. El análisis lo encuentra después. La anonimización en la capa MCP evita que llegue al modelo.

Los 39 millones de filtraciones en GitHub documentan un canal. La exposición a través de herramientas de IA es el mismo problema en un canal con menos monitoreo y sin pista de auditoría. La prevención antes de la transmisión cubre ambos.

Fuentes

¿Listo para proteger sus datos?

Comience a anonimizar PII con más de 285 tipos de entidades en 48 idiomas.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.