By · Last updated 2026-03-29

블로그로 돌아가기AI 보안

GitHub 3,900만 건 유출: AI 코딩 위험

개발자의 67%가 실수로 코드에서 비밀정보를 노출한 경험이 있습니다(GitGuardian 2025). 2024년 GitHub에서 3,900만 건의 비밀정보가 유출됐습니다. 전년 대비 25% 증가입니다.

March 29, 20268 분 읽기
GitHub secret leaksdeveloper AI securitycredential exposureMCP Server protectionGitGuardian 2025

1년에 3,900만 건의 자격 증명 유출

GitHub의 Octoverse 2024 보고서는 2024년 GitHub에서 3,900만 건의 비밀정보가 유출됐음을 발견했습니다. 이것은 2023년 대비 25% 전년 대비 증가입니다. 비밀정보에는 API 키, 데이터베이스 문자열, 인증 토큰, 클라우드 자격 증명이 포함됩니다.

원인은 알려져 있습니다. 개발자들은 비밀정보가 포함된 코드를 커밋합니다. 비밀정보는 디버그 세션에서 옵니다. 또는 환경 변수에 저장하는 대신 하드코딩됩니다. 3,900만 건 유출에서, 이것은 드문 일이 아닙니다. 일상입니다.

AI 도구가 두 번째 유출 채널을 추가합니다

GitGuardian의 2025년 연구는 개발자의 67%가 실수로 코드에서 비밀정보를 노출한 경험이 있음을 발견했습니다. GitHub 유출을 만드는 같은 습관이 AI 도구 유출도 만듭니다.

개발자가 도움을 위해 Claude, ChatGPT 또는 다른 AI 어시스턴트에 코드를 붙여넣습니다. 그 코드에는 종종 라이브 자격 증명이 있습니다. AI 모델은 비밀정보를 받습니다. 대화 기록에 저장할 수 있습니다. 제공업체 서버로 전송합니다. 개발자는 경고 없이 통제를 잃습니다.

세 가지 예:

데이터베이스 디버깅. 개발자가 스택 추적을 붙여넣습니다. 추적에 연결 문자열이 포함됩니다. AI가 비밀번호도 읽습니다.

파이프라인 검토. 개발자가 데이터 파이프라인 스크립트를 공유합니다. 스크립트에 AWS 액세스 키와 비밀 키가 있습니다. AI가 둘 다 받습니다.

API 통합 검토. 개발자가 통합에 대한 피드백을 요청합니다. 코드에 라이브 파트너 API 키가 포함됩니다. 키가 개발자 네트워크를 벗어납니다.

각 경우, 목표는 합법적인 도움입니다. 자격 증명 유출은 AI에게 충분한 맥락을 제공하는 부작용입니다.

MCP 아키텍처가 유출을 차단하는 방법

Claude Desktop 또는 Cursor IDE를 사용하는 팀에게, 모델 컨텍스트 프로토콜(MCP) 서버 아키텍처는 개발자와 AI 모델 사이의 경로에 자격 증명 필터를 배치합니다.

MCP 서버는 세션을 통해 이동하는 모든 텍스트를 처리합니다. 붙여넣은 코드, 스택 추적, 구성 파일, 디버그 맥락 — 모두 모델이 보기 전에 익명화 단계를 통과합니다.

엔진은 자격 증명 패턴을 찾습니다: API 키 형식, 데이터베이스 문자열, OAuth 토큰, 개인 키 헤더, 보안팀이 정의하는 사용자 지정 형식. 각 일치는 전송 전에 토큰으로 교체됩니다.

실제로 작동하는 방식:

개발자가 데이터베이스 연결 문자열이 있는 스택 추적을 붙여넣습니다. MCP 서버가 문자열을 [DB_CONNECTION_1]로 교체합니다. AI는 토큰이 포함된 추적을 봅니다. 익명화된 버전을 기반으로 디버깅 도움을 제공합니다. 실제 자격 증명은 내부 네트워크를 절대 벗어나지 않았습니다.

이것은 GitHub를 비밀정보로 채우는 동일한 유출 벡터를 차단합니다. 채널이 다릅니다 — AI 도구, git 커밋이 아님 — 그러나 해결책은 같은 방식으로 작동합니다: 전송 전에 차단합니다.

사후 탐지는 너무 늦습니다

일부 팀은 유출된 비밀정보를 잡기 위해 사후 커밋 스캐닝을 사용합니다. GitGuardian과 truffleHog는 GitHub 채널에서 잘 작동합니다. AI 도구 세션은 다루지 않습니다.

비밀정보가 AI 제공업체 서버에 도달하면, 노출이 완료됩니다. 스캐닝은 사후에 발견합니다. MCP 레이어 익명화는 모델에 도달하기 전에 차단합니다.

3,900만 건의 GitHub 유출은 하나의 채널을 문서화합니다. AI 도구 노출은 모니터링이 적고 감사 추적이 없는 채널에서 같은 문제입니다. 전송 전 예방이 둘 다 다룹니다.

출처

데이터 보호를 시작할 준비가 되셨나요?

48개 언어로 285개 이상의 엔티티 유형으로 PII 익명화를 시작하세요.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.