By · Last updated 2026-03-13

Tornar al BlogSeguretat de la IA

Samsung va Perdre Codi Font a ChatGPT 3 Vegades

Tres equips d'enginyeria de Samsung separats van enganxar codi propietari i dades confidencials a ChatGPT l'abril del 2023. Cada incident va revelar una vulnerabilitat diferent.

March 13, 20269 min llegit
Samsung ChatGPT leaksource code protectionenterprise AI controlsinsider data leakageMCP Server anonymization

Actualitzat per al 2026

Tres Equips, Tres Fuites, Un Mes

L'abril del 2023, Samsung Semiconductor va divulgar tres incidents separats. Tres equips diferents havien enviat dades propietaries a un xatbot d'IA en un sol mes. Els incidents no estaven relacionats. Persones diferents, rols diferents, dies diferents.

Nomes compartien dos trets. Cadascuna va usar l'eina per fer feina real. Cadascuna va enviar accidentalment dades que Samsung no pretenia compartir fora de l'empresa.

Incident 1 -- Codi font. Un enginyer de programari estava depurant codi d'equips. Va enganxar codi font propietari de semiconductors al xat. El codi contenia propietat intel.lectual de fabricacio.

Incident 2 -- Notes de reunio. Una empleada estava preparant un resum d'una reunio. Va enviar les seves notes perque la IA les condenses. Aquelles notes contenien estrategia confidencial i detalls del full de ruta.

Incident 3 -- Consulta de base de dades. Un tercer empleat volia ajuda amb una consulta lenta. Va compartir l'estructura de la base de dades i la logica de la consulta. Aquella logica feia referencia a esquemes i regles de negoci propietaris.

Tres incidents. Tres divulgacions. Un mes.

Per Que ho Van Fer els Empleats

Cap dels tres actuava de manera descuidada. Van usar una eina d'IA per a tasques per a les quals les eines d'IA estan dissenyades. Revisio de codi. Resum de text. Optimitzacio de consultes. Cada tasca era legítima.

El que faltava era una aturada tecnica. Cap sistema va bloquejar l'enviament abans que arribes a un servidor extern. Cap filtre va capturar identificadors propietaris abans que sortissin de la xarxa. Res no s'interposava entre la necessitat real de l'empleat i el servei extern.

Existia un avis de politica. Pero un avis no es una barrera. El risc d'un error accidental era abstracte i llunya. El benefici de productivitat era real i immediat. Els treballadors racionals van triar la productivitat.

El resultat era previsible. Tres incidents en trenta dies. Tres divulgacions de propietat intel.lectual. Una crisi corporativa que va desencadenar prohibicions a tot el sector.

La Reaccio del Sector

Samsung va actuar rapidament. Va tallar l'acces a les eines d'IA en dispositius corporatius.

Altres organitzacions van seguir. Les que van anunciar restriccions inclouen el Bank of America, Citigroup, Goldman Sachs, JPMorgan Chase, Apple i Verizon. El sector financer va reaccionar mes de pressa. Els grans bancs i empreses tecnologiques van arribar a la mateixa conclusio. Les eines d'IA sense controls tecnics comportaven un risc de conformitat inacceptable.

Totes van arribar a la mateixa conclusio. Els empleats no son el problema. Els avisos de politica no son suficients. Les dades van sortir de les xarxes corporatives perque res no les va aturar. La politica sola no pot crear una aturada tecnica.

La Taxa de Circumvencio del 71,6%

L'enfocament de la prohibicio te una taxa de fallada mesurada. La recerca de LayerX del 2025 va trobar que el 71,6% dels empleats subjectes a prohibicions d'IA empresarial van continuar usant eines d'IA. Van usar comptes personals o dispositius personals.

La rao es senzilla. Una eina que ofereix valor real s'usa. La gent troba maneres d'evitar les restriccions en lloc de renunciar-hi. La IA pot reduir el temps de les tasques a la meitat. Un avis de politica no canviara aquest calcul. Els treballadors inicien sessio des d'un telefon o portatil personal. Els equips de seguretat no poden veure aquell transit.

El resultat practi e el pitjor cas. Les dades corporatives continuen arribant als proveïdors d'IA. Pero ara flueixen per canals sense cap supervisio. El transit de dispositius corporatius almenys es podia registrar. L'us de comptes personals es invisible.

Els tres incidents de Samsung van succeir en dispositius corporatius. Els empleats que circumventen la prohibicio fan el mateix. Envien dades de treball als models d'IA. Pero ara ho fan per canals sense visibilitat empresarial.

La Solucio Tecnica que Aborda la Causa Arrel

Els incidents de Samsung no els van causar persones descuidades. Els va causar una arquitectura sense capa d'interceptacio. No hi havia res entre el prompt de l'empleat i el servidor del proveidor.

L'arquitectura del Protocol de Context de Model (MCP) omple aquest buit. Col.loca un proxy transparent en el cami de les dades. Els desenvolupadors que usen Claude Desktop o Cursor IDE son el public principal. Aquestes son exactament les eines usades per al tipus de depuracio de codi darrere del primer incident de Samsung. El Servidor MCP s'ubica dins del cami del protocol per a tots dos.

Abans que qualsevol text arribi al model d'IA, el Servidor MCP el processa en un pas d'anonimitzacio. El codi font s'analitza per detectar identificadors propietaris. Els noms de funcions, noms de variables i punts finals d'API se substitueixen per tokens estructurats. Els detalls de l'esquema de la base de dades i els valors de configuracio tambe se substitueixen. L'intercanvi passa abans que el codi surti de la vostra xarxa.

Un desenvolupador que depura codi propietari envia codi a traves del client MCP. Els identificadors sensibles ja son tokens en aquell moment. El model d'IA continua ajudant amb la tasca de depuracio. Els detalls propietaris reals mai no arriben als servidors del proveidor.

L'incident 1 esdeve tecnicament impossible. El codi font surt de la xarxa ja anonimitzat. L'enginyer rep l'ajuda que necessitava. La propietat intel.lectual roman sota control de l'empresa.

La mateixa logica cobreix l'incident 2. El resum de notes de reunio a traves d'eines basades en el navegador s'aborda amb la Extensio Chrome i els seus controls empresarials. L'incident 3 el cobreix l'anonimitzacio MCP en qualsevol interficie de codificacio d'IA.

Prohibicions vs. Controls Tecnics

Prohibir eines que el 71,6% dels empleats ja circumventen no redueix el risc. Mou el risc a canals invisibles.

L'eina de comparacio de DLP de navegador cobreix les opcions d'interceptacio per a l'us de la IA al navegador. Per a organitzacions que comparen l'anonimitzacio amb altres productes DLP, la comparacio de Nightfall vs. anonym.legal cobreix directament el compromis entre bloqueig i anonimitzacio.

Els incidents de Samsung van ser un senyal primerenc. La causa arrel era una absencia. Cap capa d'interceptacio. Cap control tecnic. Aquell buit es pot solucionar ara. La questio es si les empreses despleguen la solucio o continuen confiant en prohibicions que la majoria dels empleats ja eludeixen.

Fonts

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.