39 միլլիոն Credential Արտահոս մեկ Տարին
GitHub-ի Octoverse 2024 զեկույցունն արձանագրել է 39 միլլիոն գաղտնիք արտահոս GitHub-ում 2024-ին. այս 25%-անոցպ տարեկան ավելացություն է 2023-ի համետատումբով. Գաղտնիքներն են API բանալիներ, տարազայի տարգներ, auth token-ներ և ամպայի credentials.
Փատչառակույթնն հայտնի է. ծրագրավորներն code են կատում gaqtniqnerov ներս. Գաղտնիքներն գալիս են debug session-ներից. Կամ hardcode-ած են env variable-ների պոխարեն. 39 միլլիոն արտահոսի դեպքումում, այս հազվադեպ չի. Այս բանալ է.
AI գործիքներն Ավելացնում են Արտահոսի Երկրորդ Ուժ
GitGuardian-ի 2025 հետազոտությունն հայտնաբերեց, վոր ծրագրավորների 67%-ն պատահական կերպով բացահայտվել է գաղտնիքներ code-ի մեջ. Նույն ուրվազքներն, վորոնք GitHub-ի արտահոսներ են ստվում, նույնայնպես AI գործիքների արտահոսներ են ստվում.
ծրագրավորն paste է անում code Claude-ի, ChatGPT-ի կամ այլ AI ոգնակալի մեջ. Այդ code-ում հաբածակի live credentials կա. AI model-ն ստանում է գաղտնիքն. Կարող է պահել conversation history-ում. ուգհարկվում է provider-ի server-ներ. ծրագրավորն կորում է վերահսկողությունն առանց նախազգուչտում.
երեք որինակ:
Դատաբազի debug session. ծրագրավորն paste է անում stack trace. Trace-ում connection string կա. AI-ն կարդում է նաև password-ն.
Pipeline-ի վերչանայում. ծրագրավորն կազմակում է data pipeline script. Script-ում AWS access key և secret key կա. AI-ն ստանում է երկուսն ել.
API ինտեգրալի վերչանայում. ծրագրավորն արծագ է խնդրում ինտեգրալի-ի վերաբերյալ. Code-ում live partner API բարդզաք կա. Բարդզաք-ն արտականում է ծրագրավորի ցանցիցից.
ամեն դեպքումում, նպատակն իրավական վոջողմում ստանալն է. Credential-ի արտահոսն AI-ին բավարար context ստանալումի կոլմնային հետևանկ է. Նույն կաղապարն է ինչպես GitHub-ի արտահոսների նաման կա, չի չարամտական, բայց ուգրութական.
CI/CD Pipeline-ներն նույնայնպես Ռիսկ-ի Տակ ենն
CI/CD pipeline-ի գաղտնիք արտահոսներ 2024-ին ավլացել են 34%-ով. Build script-ները, deploy config-ները և infrastructure-as-code ֆայլ-ներն ամենայնի անցնում են AI վերչանայումի միջով. Այդ ֆայլ-ներում հաբածակի ամպային credentials և service account token-ներ կա.
քանզի AI գործիքներն ծագոոմում են ծրագավորման ավելի մետս մերէ, բացահայտականումն ավելի մետս մակերեստ է լինում նրանցից.
Ինչպես MCP Architecture-ն կանգում է Արտահոսներն
Claude Desktop կամ Cursor IDE ոգտագորսողհ տիմերի համար, Model Context Protocol (MCP) server architecture credential filter է դատսում ծրագրավորի և AI model-ի API-ի միջեվ.
MCP server-ն կարգավարում է սեսիայի ենդացքումում անցնող ամեն տեկստ. Paste-ած code, stack trace, config ֆայլ, debug context, ամենայնի անցնում է անոնիմացիայի քայլով նախքան model-ն տեսնի.
հայտնաբերում է credential կաղապներ: API բարդզաք format-ներ, տարազային տարգներ, OAuth token-ներ, private key header-ներ և դզերի անվաղուչի տիմի սահմանատնեդ կոոզկային format-ներ. ամեն հակակայտում բացատարում է token-ով նախքան ուգհարկկումն.
Ռինչ կտեսնեք գործնականում: ծրագրավորն paste է անում stack trace տարազայի connection string-ով. MCP server-ն string-ն բացատարում է [DB_CONNECTION_1]-ով. AI-ն տեսնում է trace-ն token-ով. վոջողմումն տալիս է անոնիմացված վարկյակի հակակայտումից. իրականական credential-ն երբեք չի արտականում է ներկային ցանցիցից.
այս կանգնում է նույն արտահոս vector-ին, վորին GitHub-ը գաղտնիքներով լարենում. Կանալ-ն տարբերում է. AI գործիքներ, git commit-ներ չի. բայց ուղեչույնն նույն է. կարանգում է արտահոսից նախքան.
Մեր անվաղուչի աղվարդում ինչպես anonym.legal-ն կարարավարում է AI գործիքների և ֆայլ-ների workflow-ների համար, և համապատաստման կենտրոն audit վերահսկելուների համար.
Գերգյիցս հետո կանսահայտումն այլանդ է
Մի քանի տիմեր post-commit scanning կիրիարում են արտահոսած գաղտնիքների կանսահայտումին. GitGuardian և truffleHog լավ են գործում GitHub-ի կանալ-ի համար. AI գործիք session-ների համար չեն ծագոոմում.
Երբ գաղտնիք է հասի AI provider-ի server-ներ, բացահայտականումն լրիվ է. Scanning-ն գտնում է հետո. MCP-ի անոնիմացիա գործնադրումն կապոոմում է model-ի մոտ հասի.
39 միլլիոն GitHub արտահոսներն խոսում են մեկ կանալ-ի վերաբերյալ. AI գործիք-ի բացահայտականումն նույն խնդիրն է, մի կանալ-ում, որտեղ ավելի բակլ gortsiq չի կա և audit ուղի չի. նախքին արտահոսից կանխումն երկուսն ել ծագոոմում է.