39 millones de credenciales filtradas en un año
El informe Octoverse 2024 de GitHub documentó 39 millones de secretos filtrados en GitHub durante 2024. Eso es un aumento del 25 % respecto al año anterior 2023. Los secretos incluyen claves API, cadenas de conexión, tokens de autenticación y credenciales en la nube.
La causa es conocida. Los desarrolladores hacen commits de código con secretos dentro. Los secretos vienen de sesiones de depuración. O están codificados de forma fija en lugar de almacenarse en variables de entorno. Con 39 millones de filtraciones, esto no es raro. Es rutinario.
Las herramientas de IA crean un segundo canal de fuga
La investigación de GitGuardian de 2025 encontró que el 67 % de los desarrolladores han expuesto accidentalmente secretos en código. Los mismos hábitos que generan filtraciones en GitHub también generan filtraciones en herramientas de IA.
Un desarrollador pega código en Claude, ChatGPT u otro asistente de IA para pedir ayuda. Ese código suele contener credenciales activas. El modelo de IA recibe el secreto. Puede almacenarlo en el historial de conversación. Lo transmite a los servidores del proveedor. El desarrollador pierde el control, sin ninguna advertencia.
Tres ejemplos:
Depuración de base de datos. Un desarrollador pega un stack trace. El trace incluye la cadena de conexión. El modelo de IA también lee la contraseña.
Revisión de pipeline. Un desarrollador comparte un script de pipeline de datos. El script contiene una clave de acceso de AWS y una clave secreta. El modelo de IA recibe ambas.
Revisión de integración API. Un desarrollador pide retroalimentación sobre una integración. El código incluye una clave API activa de un partner. La clave sale de la red del desarrollador.
En cada caso, el propósito es legítimo. La filtración de credenciales es un efecto secundario de dar suficiente contexto al modelo. Es el mismo patrón que las filtraciones en GitHub — sin intención maliciosa, solo por rutina.
Los pipelines de CI/CD también están expuestos
Las filtraciones de secretos en pipelines CI/CD aumentaron un 34 % en 2024. Los scripts de build, las configs de despliegue y los archivos de infraestructura como código ahora pasan todos por revisión con IA. Estos archivos suelen contener credenciales en la nube y tokens de cuenta de servicio.
A medida que las herramientas de IA cubren más del ciclo de desarrollo — revisión, documentación, depuración, optimización — la superficie de exposición crece con ellas.
La arquitectura MCP bloquea las fugas
Para equipos que usan Claude Desktop o Cursor IDE, la arquitectura de servidor MCP (Model Context Protocol) coloca un filtro de credenciales entre el desarrollador y el modelo de IA.
El servidor MCP maneja todo el texto que fluye por la sesión. Código pegado, stack traces, archivos de configuración, contexto de depuración — todo pasa por un paso de anonimización antes de que el modelo lo vea.
El motor detecta patrones de credenciales: formatos de claves API, cadenas de conexión, tokens OAuth, encabezados de claves privadas y formatos personalizados que define su equipo de seguridad. Cada coincidencia se reemplaza con un token antes de la transmisión.
Lo que esto significa en la práctica:
Un desarrollador pega un stack trace con una cadena de conexión a una base de datos. El servidor MCP reemplaza la cadena por [DB_CONNECTION_1]. El modelo de IA ve el trace con el token en su lugar. Proporciona ayuda de depuración basada en la versión anonimizada. Las credenciales reales nunca salieron de la red interna.
Esto detiene el mismo vector de fuga que llena GitHub de secretos. El canal es diferente — herramientas de IA en lugar de commits git — pero la solución funciona igual: bloquear antes de transmitir.
Nuestra descripción de seguridad explica cómo anonym.legal aplica esto en herramientas de IA y flujos de trabajo documentales. El centro de cumplimiento cubre los controles de auditoría.
La detección a posteriori llega demasiado tarde
Algunos equipos utilizan el análisis post-commit para detectar secretos filtrados. GitGuardian y truffleHog funcionan bien para el canal de GitHub. No cubren las sesiones de herramientas de IA.
Cuando un secreto llega a los servidores de un proveedor de IA, la exposición ya ocurrió. El análisis lo encuentra después. La anonimización en la capa MCP evita que llegue al modelo.
Los 39 millones de filtraciones en GitHub documentan un canal. La exposición a través de herramientas de IA es el mismo problema en un canal con menos monitoreo y sin pista de auditoría. La prevención antes de la transmisión cubre ambos.