By · Last updated 2026-03-13

Bumalik sa BlogSeguridad ng AI

Tatlong Beses Nawala ang Source Code ng Samsung sa ChatGPT

Tatlong magkakahiwalay na koponan ng engineering ng Samsung ang nagpaste ng proprietary code at kumpidensyal na data sa ChatGPT noong Abril 2023. Ang bawat insidente ay nagpakita ng ibang aspeto ng panganib.

March 13, 20269 min basahin
Samsung ChatGPT leaksource code protectionenterprise AI controlsinsider data leakageMCP Server anonymization

Na-update para sa 2026

Tatlong Koponan, Tatlong Leak, Isang Buwan

Noong Abril 2023, nagsimula ng tatlong magkakahiwalay na insidente ang Samsung Semiconductor. Tatlong magkakaibang koponan ang nagpadala ng proprietary data sa isang AI chatbot sa loob ng isang buwan. Hindi magkaugnay ang mga insidente. Magkakaibang tao, magkakaibang papel, magkakaibang araw.

May dalawa lamang silang katangiang magkatulad. Ang bawat isa ay gumamit ng tool para gumawa ng tunay na trabaho. Ang bawat isa ay aksidenteng nagpadala ng data na hindi inisip ng Samsung na ibahagi sa labas ng kumpanya.

Insidente 1 -- Source code. Isang software engineer ang nag-debug ng code ng kagamitan. Nagpaste siya ng proprietary semiconductor source code sa chat. Ang code ay may manufacturing IP.

Insidente 2 -- Mga tala ng pulong. Isang empleyado ang naghahanda ng buod ng isang pulong. Isinumite niya ang kanyang mga tala para i-condense ng AI. Ang mga talang iyon ay naglalaman ng kumpidensyal na estratehiya at mga detalye ng roadmap.

Insidente 3 -- Database query. Gusto ng ikatlong empleyado ng tulong sa isang mabagal na query. Ibinahagi niya ang istruktura ng database at ang lohika ng query. Ang lohikang iyon ay tumutukoy sa mga proprietary schema at mga tuntunin ng negosyo.

Tatlong insidente. Tatlong paglalantad. Isang buwan.

Bakit Ginawa Ito ng mga Empleyado

Wala sa tatlo ang kumikilos nang walang ingat. Gumamit sila ng isang AI tool para sa mga gawain na ginawa ang mga AI tool. Code review. Pagsusuma ng teksto. Pag-optimize ng query. Ang bawat gawain ay lehitimo.

Ang nawawalang piraso ay isang teknikal na hinto. Walang sistema ang huminto sa pagsumite bago ito maabot ang isang external na server. Walang filter ang nahuli sa mga proprietary identifier bago umalis ang mga ito sa network. Walang nakatayo sa pagitan ng tunay na pangangailangan ng empleyado at ng external na serbisyo.

May babala ng patakaran. Ngunit ang babala ay hindi isang hadlang. Ang panganib ng isang aksidenteng pagkakamali ay abstract at malayo. Ang benepisyo ng produktibidad ay tunay at agarahan. Pinili ng mga makatwirang manggagawa ang produktibidad.

Ang resulta ay mahuhulaan. Tatlong insidente sa loob ng tatlumpung araw. Tatlong paglalantad ng IP. Isang corporate na krisis na nagpukaw ng mga ban sa buong industriya.

Ang Reaksyon ng Industriya

Mabilis na kumilos ang Samsung. Pinigilan nito ang access sa AI tool sa mga corporate na device.

Sumalungguhit ang ibang mga organisasyon. Kasama sa mga nag-anunsyo ng mga paghihigpit ang Bank of America, Citigroup, Goldman Sachs, JPMorgan Chase, Apple, at Verizon. Pinakamabilis na nagreaksyon ang sektor ng pananalapi. Ang mga malalaking bangko at tech firm ay nakarating sa parehong konklusyon. Ang mga AI tool na walang teknikal na mga kontrol ay nagdulot ng hindi katanggap-tanggap na panganib sa pagsunod.

Bawat isa sa kanila ay nakarating sa parehong natuklasan. Ang mga empleyado ay hindi ang problema. Hindi sapat ang mga babala ng patakaran. Umalis ang data sa mga corporate na network dahil walang pumigil dito. Ang patakaran lamang ay hindi makakalikha ng teknikal na hinto.

Ang 71.6% na Rate ng Pag-bypass

Ang diskarteng pag-ban ay may nasukat na rate ng pagkabigo. Natuklasan ng pananaliksik ng LayerX mula sa 2025 na 71.6% ng mga empleyado na napapailalim sa mga enterprise AI ban ay patuloy na gumagamit ng mga AI tool. Gumamit sila ng mga personal na account o personal na device.

Simple ang dahilan. Ang isang tool na naghahatid ng tunay na halaga ay ginagamit. Naghahanap ng mga paraan ng pag-iiwas ang mga tao sa halip na isuko ito. Ang AI ay maaaring mag-cut ng oras ng gawain nang kalahati. Hindi magbabago ng kalkulasyong iyon ang isang babala ng patakaran. Nagla-log in ang mga manggagawa mula sa isang personal na telepono o laptop. Hindi makikita ng mga security team ang trapikong iyon.

Ang praktikal na resulta ay ang pinakamasamang kaso. Ang data ng korporasyon ay umabot pa rin sa mga AI provider. Ngunit ngayon ay dumadaan ito sa mga channel na walang anumang pangangasiwa. Ang trapiko ng corporate device ay maaari man lang ma-log. Ang paggamit ng personal na account ay hindi nakikita.

Ang tatlong insidente ng Samsung ay nangyari sa mga corporate na device. Ang mga empleyado na nag-bypass ng ban ay gumagawa ng parehong bagay. Nagpapadala sila ng data ng trabaho sa mga AI model. Ngunit ngayon ay dumadaan ito sa mga channel na walang enterprise visibility.

Ang Teknikal na Solusyon na Tumutugon sa Ugat ng Sanhi

Hindi sanhi ng mga walang ingat na tao ang mga insidente ng Samsung. Sanhi ng mga ito ay isang arkitektura na walang interception layer. Walang nasa pagitan ng prompt ng empleyado at ng server ng vendor.

Ang arkitektura ng Model Context Protocol (MCP) ay nagpupuno ng agwat na iyon. Naglalagay ito ng transparent na proxy sa landas ng data. Ang mga developer na gumagamit ng Claude Desktop o Cursor IDE ang pangunahing target na audience. Ang mga iyon ay eksaktong mga tool na ginagamit para sa uri ng code debugging na nasa likod ng unang insidente ng Samsung. Ang MCP Server ay nasa loob ng landas ng protokol para sa pareho.

Bago maabot ng anumang teksto ang AI model, pinapatakbo ito ng MCP Server sa pamamagitan ng isang hakbang ng anonymization. Ang source code ay sinusuri para sa mga proprietary identifier. Ang mga pangalan ng function, pangalan ng variable, at mga API endpoint ay pinapalitan ng mga structured token. Pinalitan din ang mga detalye ng database schema at mga halaga ng config. Ang palitan ay nangyayari bago umalis ang code sa inyong network.

Ang isang developer na nag-debug ng proprietary code ay nagpapadala ng code sa pamamagitan ng MCP client. Ang mga sensitibong identifier ay mga token na sa puntong iyon. Tinutulungan pa rin ng AI model ang debug na gawain. Ang aktwal na mga proprietary na detalye ay hindi kailanman umaabot sa mga server ng vendor.

Ang Insidente 1 ay nagiging teknikal na imposible. Ang source code ay lumalabas sa network na anonymized na. Nakukuha ng engineer ang tulong na kailangan niya. Ang IP ay nananatili sa ilalim ng kontrol ng kumpanya.

Ang parehong lohika ay sumasaklaw sa Insidente 2. Ang pagsusuma ng tala ng pulong sa pamamagitan ng mga browser-based na tool ay tinatugon ng Chrome Extension at ang mga enterprise control nito. Ang Insidente 3 ay saklaw ng MCP anonymization sa anumang AI coding interface.

Mga Ban kumpara sa mga Teknikal na Kontrol

Ang pag-ban ng mga tool na 71.6% ng mga empleyado ay ina-bypass na ay hindi nagbabawas ng panganib. Inilipat nito ang panganib sa mga hindi nakikitang channel.

Sinasaklaw ng paghahambing ng browser DLP tool ang mga opsyon ng interception para sa browser-based na paggamit ng AI. Para sa mga organisasyong nagkukumpara ng anonymization sa iba pang mga produkto ng DLP, direktang sinasaklaw ng paghahambing ng Nightfall vs. anonym.legal ang tradeoff ng pag-block-vs-anonymization.

Ang mga insidente ng Samsung ay isang maagang signal. Ang ugat na sanhi ay isang kawalan. Walang interception layer. Walang teknikal na kontrol. Ang agwat na iyon ay naayos na ngayon. Ang tanong ay kung mag-de-deploy ba ang mga enterprise ng solusyon, o patuloy na umaasa sa mga ban na karaniwang ino-bypass na ng karamihan sa mga empleyado.

Mga Pinagkukunan

Handa nang protektahan ang iyong data?

Simulan ang anonymization ng PII gamit ang 285+ uri ng entidad sa 48 wika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.