By · Last updated 2026-03-13

Kembali ke BlogKeamanan AI

Samsung Kehilangan Kode Sumber ke ChatGPT 3 Kali

Tiga tim insinyur Samsung yang berbeda menempelkan kode kepemilikan dan data rahasia ke ChatGPT pada April 2023. Setiap insiden mengungkapkan kelemahan yang berbeda.

March 13, 20269 menit baca
Samsung ChatGPT leaksource code protectionenterprise AI controlsinsider data leakageMCP Server anonymization

Tiga Tim Insinyur, Tiga Insiden, Satu Bulan

Pada April 2023, Samsung Semiconductor mengungkapkan tiga insiden terpisah di mana karyawan telah mengirimkan data kepemilikan ke ChatGPT dalam satu bulan.

Insiden-insiden tersebut tidak saling terkait satu sama lain. Mereka melibatkan karyawan yang berbeda dengan peran berbeda, mengejar tugas yang berbeda, pada hari yang berbeda. Keduanya hanya memiliki dua karakteristik yang sama: setiap karyawan menggunakan ChatGPT untuk mencapai tujuan kerja yang sah, dan masing-masing secara tidak sengaja mengirimkan data yang tidak dimaksudkan Samsung untuk dibagikan dengan infrastruktur OpenAI.

Insiden 1: Seorang insinyur perangkat lunak sedang men-debug kode terkait peralatan semikonduktor. Men-debug sistem kompleks adalah kasus penggunaan alat AI yang umum — menyediakan kode ke model AI dan memintanya mengidentifikasi sumber perilaku yang tidak terduga. Insinyur tersebut menempelkan kode sumber dari sistem peralatan semikonduktor Samsung yang bersifat kepemilikan ke ChatGPT. Kode tersebut mengandung kekayaan intelektual yang berkaitan dengan proses manufaktur Samsung.

Insiden 2: Seorang karyawan sedang menyiapkan ringkasan rapat. Pencatatan dan ringkasan rapat berbantuan AI telah menjadi alat alur kerja standar di berbagai industri. Karyawan tersebut menyerahkan catatan rapat ke ChatGPT untuk diringkas. Catatan rapat tersebut mengandung diskusi internal rahasia — strategi bisnis, peta jalan teknis, dan informasi lain yang dianggap Samsung tidak bersifat publik.

Insiden 3: Karyawan ketiga mencari saran optimasi untuk kueri database. Optimasi database adalah tugas yang secara teknis menuntut di mana bantuan AI memberikan nilai nyata. Karyawan tersebut menyediakan struktur database dan logika kueri ke ChatGPT. Logika kueri mengandung referensi ke struktur data kepemilikan dan logika bisnis.

Mengapa Karyawan Melakukannya

Tidak satu pun dari tiga karyawan Samsung tersebut yang bertindak sembarangan menurut standar profesional mereka sendiri. Mereka menggunakan alat AI untuk tugas-tugas yang memang dirancang untuk dibantu oleh alat AI: debugging kode, peringkasan teks, optimasi teknis.

Elemen yang hilang dalam setiap kasus adalah hambatan teknis. Tidak ada sistem yang mencegat pengiriman sebelum mencapai server OpenAI. Tidak ada kontrol yang menandai pengidentifikasi kode kepemilikan sebelum meninggalkan jaringan perusahaan. Tidak ada lapisan arsitektur yang berdiri di antara kebutuhan kerja sah karyawan dan infrastruktur penyedia AI.

Karyawan bertindak rasional. Alat AI memberikan bantuan nyata untuk tugas kerja yang sah. Peringatan kebijakan ada tetapi tidak memaksakan hambatan teknis. Konsekuensi dari ketidakpatuhan — potensi tindakan disipliner untuk tindakan yang tidak disengaja — bersifat abstrak dan jauh dibandingkan manfaat produktivitas langsung dari alat tersebut.

Hasilnya: tiga insiden dalam satu bulan, tiga pengungkapan informasi kepemilikan, dan krisis perusahaan yang memicu gelombang larangan AI perusahaan secara global.

Respons Industri

Respons internal Samsung cepat: akses ChatGPT dibatasi untuk perangkat perusahaan. Pengungkapan tersebut memicu reaksi industri yang lebih luas yang mengungkapkan betapa meluasnya kondisi mendasar tersebut.

Organisasi yang mengumumkan larangan atau pembatasan alat AI setelah pengungkapan Samsung mencakup Bank of America, Citigroup, Goldman Sachs, JPMorgan Chase, Apple, dan Verizon. Respons sektor keuangan sangat komprehensif — beberapa lembaga besar secara bersamaan menyimpulkan bahwa profil risiko alat AI tanpa kontrol teknis tidak sesuai dengan kewajiban kepatuhan mereka.

Setiap organisasi mencapai kesimpulan yang sama: karyawan bukan masalahnya, dan peringatan kebijakan bukan kontrol yang memadai. Data meninggalkan jaringan mereka karena tidak ada hambatan teknis yang mencegahnya, dan kebijakan saja tidak dapat menciptakan hambatan teknis.

Tingkat Bypass 71,6%

Pendekatan larangan memiliki tingkat kegagalan yang terdokumentasi. Penelitian LayerX dari 2025 menemukan bahwa 71,6% karyawan yang tunduk pada larangan AI perusahaan terus menggunakan alat AI melalui akun atau perangkat pribadi.

Tingkat bypass mencerminkan perilaku dasar: ketika alat memberikan nilai produktivitas nyata, pengguna mencari cara lain daripada meninggalkan alat tersebut secara permanen. Karyawan yang menemukan bahwa bantuan AI secara substansial mempercepat output kerja mereka tidak akan berhenti menggunakan alat tersebut karena kebijakan perusahaan melarangnya di perangkat perusahaan. Mereka akan menggunakan akun pribadi di perangkat pribadi melalui saluran yang tidak dapat dilihat tim keamanan.

Konsekuensi praktis dari tingkat bypass 71,6% adalah bahwa larangan AI mencapai hasil terburuk yang mungkin: data perusahaan mencapai penyedia AI melalui saluran tanpa kontrol keamanan sama sekali. Setidaknya akses perangkat perusahaan secara teoritis dapat dipantau. Penggunaan akun pribadi sepenuhnya tidak terlihat oleh tim keamanan.

Tiga insiden Samsung terjadi di perangkat perusahaan melalui akses perusahaan. Karyawan yang melewati larangan melakukan hal yang sama — menyediakan data terkait pekerjaan ke model AI — melalui saluran tanpa pengawasan perusahaan apa pun.

Kontrol Teknis yang Mengatasi Akar Masalah

Insiden Samsung tidak disebabkan oleh kelalaian karyawan. Insiden tersebut disebabkan oleh arsitektur yang tidak menyediakan lapisan pencegatan antara penggunaan AI karyawan dan infrastruktur AI eksternal.

Arsitektur Model Context Protocol (MCP) menyediakan proxy transparan antara klien AI dan API model AI. Untuk pengembang yang menggunakan Claude Desktop atau Cursor IDE — alat utama untuk jenis debugging kode yang menyebabkan insiden pertama Samsung — MCP Server berada di jalur protokol.

Sebelum teks apa pun mencapai model AI, MCP Server memprosesnya melalui mesin anonymisasi. Kode sumber dianalisis untuk pengidentifikasi kepemilikan: nama fungsi, nama variabel, endpoint API internal, detail skema database, nilai konfigurasi. Ini diganti dengan token terstruktur sebelum kode mencapai model AI.

Seorang pengembang yang meminta Claude untuk men-debug kode semikonduktor Samsung yang bersifat kepemilikan melalui MCP Server yang dilengkapi anonymisasi akan mengirimkan kode di mana pengidentifikasi kepemilikan telah diganti dengan token. Model AI membantu tugas debugging menggunakan kode yang telah dianonimkan — yang cukup untuk analisis kode. Detail kepemilikan spesifik tidak pernah mencapai server penyedia AI.

Insiden 1 menjadi secara teknis tidak mungkin. Kode sumber meninggalkan jaringan dalam bentuk yang telah dianonimkan. AI memberikan bantuan debugging yang dibutuhkan insinyur. Kekayaan intelektual Samsung tetap berada di bawah kendali Samsung.

Arsitektur yang sama berlaku untuk Insiden 2 (ringkasan catatan rapat melalui AI berbasis browser, ditangani oleh Ekstensi Chrome) dan Insiden 3 (optimasi kueri database melalui antarmuka coding AI mana pun, ditangani oleh anonymisasi MCP).

Insiden Samsung adalah pratinjau dari masalah sistematis. Kontrol teknis yang mengatasi akar masalah kini sudah ada. Pertanyaannya adalah apakah perusahaan akan menggunakannya atau terus mengandalkan larangan yang sudah dilewati oleh 71,6% karyawan mereka.

Lihat juga:

Sumber:

Siap untuk melindungi data Anda?

Mulai anonimisasi PII dengan 285+ jenis entitas dalam 48 bahasa.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.