By · Last updated 2026-03-13

Atgal į BlogąAI Saugumas

Samsung tris kartus prarado šaltinio kodą per ChatGPT

Trys atskiros Samsung inžinerijos komandos 2023 m. balandį įklijavo nuosavybinį kodą ir konfidencialius duomenis į ChatGPT. Kiekvienas incidentas atskleidė skirtingą spragą.

March 13, 20269 min skaityti
Samsung ChatGPT leaksource code protectionenterprise AI controlsinsider data leakageMCP Server anonymization

Atnaujinta 2026 m.

Trys komandos, trys nutekėjimai, vienas mėnuo

2023 m. balandį Samsung Semiconductor atskleidė tris atskirus incidentus. Trys skirtingos komandos per vieną mėnesį išsiuntė nuosavybinę informaciją į AI pokalbių robotą. Incidentai nebuvo susiję. Skirtingi žmonės, skirtingos pareigos, skirtingos dienos.

Juos siejo tik dvi savybės. Kiekvienas asmuo naudojo įrankį tikram darbui. Kiekvienas netyčia išsiuntė duomenis, kurių Samsung neketino dalinti už įmonės ribų.

Incidentas 1 - Šaltinio kodas. Programinės įrangos inžinierius derino įrangos kodą. Jis įklijavo nuosavybinį puslaidininkių šaltinio kodą į pokalbį. Kode buvo gamybos intelektinė nuosavybė.

Incidentas 2 - Susitikimo pastabos. Darbuotoja rengė susitikimo santrauką. Ji pateikė savo pastabas AI sutrumpinti. Tos pastabos turėjo konfidencialios strategijos ir veiksmų plano detales.

Incidentas 3 - Duomenų bazės užklausa. Trečias darbuotojas norėjo pagalbos su lėta užklausa. Jis pasidalijo duomenų bazės struktūra ir užklausos logika. Ta logika rėmėsi nuosavybine schema ir verslo taisyklėmis.

Trys incidentai. Trys atskleidimai. Vienas mėnuo.

Kodėl darbuotojai tai padarė

Nė vienas iš trijų neveikė neatsargiai. Jie naudojo AI įrankį užduotims, kurioms AI įrankiai yra skirti. Kodo peržiūra. Teksto santrauka. Užklausos optimizavimas. Kiekviena užduotis buvo teisėta.

Trūko techninio sustojimo. Jokia sistema neblokavo pateikimo prieš jam pasiekiant išorinį serverį. Joks filtras nesugavo nuosavybinių identifikatorių prieš jiems paliekant tinklą. Tarp darbuotojo realaus poreikio ir išorinės paslaugos nieko nestovėjo.

Įspėjimas dėl politikos egzistavo. Tačiau įspėjimas nėra barjeras. Atsitiktinės klaidos rizika buvo abstrakti ir tolima. Produktyvumo nauda buvo reali ir tiesioginė. Racionalūs darbuotojai pasirinko produktyvumą.

Rezultatas buvo nuspėjamas. Trys incidentai per trisdešimt dienų. Trys intelektinės nuosavybės atskleidimai. Įmonės krizė, paskatinusi draudimus visoje pramonėje.

Pramonės reakcija

Samsung reagavo greitai. Ji apribojo AI įrankių prieigą įmonės įrenginiuose.

Kitos organizacijos sekė pavyzdžiu. Tarp tų, kurios paskelbė apribojimus, buvo Bank of America, Citigroup, Goldman Sachs, JPMorgan Chase, Apple ir Verizon. Finansų sektorius reagavo greičiausiai. Dideli bankai ir technologijų firmos padarė tą pačią išvadą. AI įrankiai be techninių kontrolių kelia nepriimtiną atitikties riziką.

Visos jos priėjo tą pačią išvadą. Darbuotojai nėra problema. Politikos įspėjimai nepakankami. Duomenys paliko įmonės tinklus, nes niekas jų nesustabdė. Vien politika negali sukurti techninio sustojimo.

71,6 % aplenkimo rodiklis

Draudimo metodas turi išmatuotą nesėkmės rodiklį. LayerX 2025 m. tyrimas nustatė, kad 71,6 % darbuotojų, kuriems taikomi įmonės AI draudimai, toliau naudojo AI įrankius. Jie naudojo asmeninius paskyras ar asmeninius įrenginius.

Priežastis paprasta. Įrankis, teikiantis realią vertę, naudojamas. Žmonės ieško apėjimo, o ne atsisako jo. AI gali perpus sumažinti užduoties laiką. Politikos įspėjimas to skaičiavimo nepakeis. Darbuotojai prisijungia iš asmeninio telefono ar nešiojamo kompiuterio. Saugumo komandos negali matyti to srauto.

Praktinis rezultatas yra blogiausias atvejis. Įmonės duomenys vis tiek pasiekia AI tiekėjus. Tačiau dabar jie teka per kanalus be jokios priežiūros. Įmonės įrenginių srautas bent jau galėjo būti registruojamas. Asmeninės paskyros naudojimas yra nematomas.

Samsung trys incidentai įvyko įmonės įrenginiuose. Darbuotojai, aplenkiantys draudimą, daro tą patį. Jie siunčia darbo duomenis AI modeliams. Tačiau dabar tai vyksta per kanalus be jokios įmonės matomumo.

Techninis sprendimas, sprendžiantis pagrindinę priežastį

Samsung incidentus sukėlė ne neatsargūs žmonės. Juos sukėlė architektūra be perėmimo sluoksnio. Tarp darbuotojo užklausos ir tiekėjo serverio nieko nebuvo.

Model Context Protocol (MCP) architektūra užpildo tą spragą. Ji įdeda skaidrų tarpinį serverį duomenų kelyje. Kūrėjai, naudojantys Claude Desktop ar Cursor IDE, yra pagrindinė auditorija. Tai tiksliai tie įrankiai, naudojami kodo derinimo užduočių, tokių kaip pirmasis Samsung incidentas. MCP serveris sėdi protokolo kelyje abiem.

Prieš bet kuriam tekstui pasiekiant AI modelį, MCP serveris jį apdoroja anonimizavimo žingsniu. Šaltinio kodas nuskenuojamas dėl nuosavybinių identifikatorių. Funkcijų pavadinimai, kintamųjų pavadinimai ir API galūnės pakeičiamos struktūriniais žetonais. Duomenų bazės schemos detalės ir konfigūracijos reikšmės taip pat pakeičiamos. Keitimas vyksta prieš kodui paliekant jūsų tinklą.

Kūrėjas, derinantis nuosavybinį kodą, siunčia kodą per MCP klientą. Jautrūs identifikatoriai tada jau yra žetonai. AI modelis vis tiek padeda su derinimo užduotimi. Tikrosios nuosavybinės detalės niekada nepasiekia tiekėjo serverių.

Pirmasis incidentas tampa techniškai neįmanomas. Šaltinio kodas palieka tinklą jau anonimizuotas. Inžinierius gauna reikiamą pagalbą. IP lieka įmonės kontroliuojama.

Ta pati logika apima antrąjį incidentą. Susitikimo pastabų santrauka per naršyklės įrankius sprendžiama Chrome plėtiniu ir jo įmonės kontrolėmis. Trečiasis incidentas apimamas MCP anonimizavimo bet kurioje AI kodavimo sąsajoje.

Draudimai prieš technines kontroles

Drausti įrankius, kuriuos 71,6 % darbuotojų jau apeina, nepadeda sumažinti rizikos. Tai perkelia riziką į nematomas kanalus.

Naršyklės DLP įrankių palyginimas apima perėmimo parinktis naršyklės pagrindu veikiančiam AI naudojimui. Organizacijoms, lyginančioms anonimizavimą su kitais DLP produktais, Nightfall prieš anonym.legal palyginimas tiesiogiai apima blokavimo prieš anonimizavimo kompromisą.

Samsung incidentai buvo ankstyvas signalas. Pagrindinė priežastis buvo nebuvimas. Joks perėmimo sluoksnis. Jokia techninė kontrolė. Ta spraga dabar yra ištaisoma. Klausimas yra, ar įmonės diegia sprendimą, ar toliau remiasi draudimais, kuriuos dauguma darbuotojų jau apeina.

Šaltiniai

Pasiruošę apsaugoti savo duomenis?

Pradėkite anonimizuoti PII su 285+ subjektų tipais 48 kalbomis.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.