Valós idejű személyes adat-szivárgás megelőzés: AI-adatszivárgások megakadályozása, mielőtt megtörténnének.
2026-ra frissítve.
2023 márciusában egy Samsung-mérnök forráskódot illesztett be a ChatGPT-be. A kód azonnal elhagyta a Samsung ellenőrzési körét. Egyetlen eszköz sem kapta el időben. Az utólagos biztonsági ellenőrzések nem tudnak megakadályozni AI-adatszivárgásokat. Ez az egyetlen esemény bebizonyította ezt.
Az észlelőeszközök utólag tájékoztatnak arról, ami történt. A naplóellenőrzések, a végponti DLP-eszközök és az auditnaplók mind így működnek. AI-szivárgásoknál az utólagos kezelés már késő. Az adat már elérte az AI-modellt.
A probléma mérete
Egy 2025-ös Cyberhaven-tanulmány megvizsgálta, hogyan használnak a vállalatok mesterséges intelligenciát. A megállapítások megdöbbentők voltak.
- Az összes ChatGPT-üzenet 11%-a tartalmaz személyes vagy érzékeny adatot.
- Az átlagos munkavállaló naponta 14-szer használ AI-eszközöket.
- A sűrűn használó személyzet naponta 30–50-szer lép interakcióba ezekkel.
- 11%-nál ez munkavállalónként napi 3–5 érzékeny küldést jelent.
Egy 500 sűrűn használó munkavállalóból álló vállalatnál ez napi több mint 2000 érzékeny küldést jelent. Mindegyik GDPR 83. cikk szerinti jogsértés lehet. A kockázat nem csupán jogi jellegű. A bizalom és a hírnév is forog kockán.
Az AI-üzenetekben előforduló érzékeny tartalom leggyakoribb típusai a következők.
- Ügyfelek nevei és elérhetőségi adatai.
- Számlaszámok és fizetési nyilvántartások.
- Egészségügyi dolgozóktól származó orvosi feljegyzések.
- Ügyvédektől származó ügyadatok.
- HR-csapatoktól származó alkalmazotti értékelési megjegyzések.
- Belső bevételi vagy értékesítési előrejelzések.
A tanulmány nem különíti el a szándékos és véletlen megosztást. Mindkettő ugyanolyan jogi kockázatot jelent. Az a munkavállaló, aki elfelejtett eltávolítani egy ügyfélnevet, ugyanolyan jogsértést okoz, mint az, aki figyelmen kívül hagyta a szabályt. A szándék nem változtatja meg a következményt.
Miért nem elegendő az észlelés
A hálózati ellenőrzések nem tudják olvasni a HTTPS-forgalmat TLS-blokkolás nélkül. A TLS-blokkolás többletterhet ad és adatvédelmi aggályokat vet fel. A modern böngészők gyakran elutasítják.
A végponti DLP-ügynökök figyelik a vágólap és a billentyűzet bemenetét. De késlekednek. Mire egy ügynök jelzi a mintát, az üzenet esetleg már el is lett küldve.
A szállítói auditnaplók rögzítik, hogy mit osztottak meg, miután megosztásra került. Segítenek a reagálásban. Nem akadályozzák meg a szivárgásokat.
A személyzeti képzés egy szabályzat, nem egy kontroll. A Cyberhaven-tanulmány azt mutatja, hogy az üzenetek 11%-a még a határozott szabályzatokkal rendelkező vállalatoknál is tartalmaz érzékeny tartalmat. A képzés nem akadályozza meg a véletlen megosztást vagy a munka közbeni figyelmetlenséget.
Az AI-eszközök blokkolása elveszi a teljesítménynövekedést. A munkavállalók ekkor személyes eszközeiken vagy fiókjaikon keresztül használják azokat. Ez a munkát minden felügyelet alól kivonja.
Ezek a módszerek egyike sem akadályozza meg, hogy érzékeny tartalom valós időben AI-rendszerekhez jusson.
Megelőzés a belépési ponton
Az egyetlen biztonságos védekezés az adat elfedése az üzenet elküldése előtt. Egy ügyfélnév, amelyet a böngészőből való kilépés előtt [PERSON_1]-re cserélnek, soha nem lesz látható az AI-modell számára.
Így működik a beágyazott elfedés.
- Egy munkavállaló ügyfél e-mail-jét gépeli be a Claude-ba vagy a ChatGPT-be.
- A böngészőbővítmény valós időben érzékeli a személyes adatot.
- Az entitások típuscímkékkel vannak megjelölve: SZEMÉLY, E-MAIL-CÍM, SZÁMLASZÁM.
- A munkavállaló áttekinti a megjelölt elemeket.
- Egy kattintással az összes entitás tokenekre cserélődik.
- Az elfedett üzenet elküldésre kerül.
Az AI ilyen üzenetet kap: „[PERSON_1] ügyfél a [EMAIL_1] számlán [ACCOUNT_1] számlaszámmal rendelkezik.”
Az AI kezeli a kérést. Soha nem lát valódi neveket vagy számokat. A munkavállaló kontextusból ismeri a tényleges ügyfelet.
Ennek a megközelítésnek egyértelmű előnyei vannak.
- A személyes adatok kívül maradnak a külső AI-rendszereken.
- Az ügyféladatok nem kerülnek be az AI-ek betanítókészleteibe.
- A munkavállalók megtartják az AI-eszközökhöz való hozzáférést. A teljesítmény megmarad.
Ez nem akadályozza meg a szándékos megosztást, ha egy munkavállaló megkerüli az eszközt. A fájlfeltöltések külön munkafolyamatot igényelnek. Nincs tökéletes kontroll. De a beágyazott elfedés eltávolítja a véletlen csoportot. Ez a csoport adja az incidensek többségét. Az eredmény a kockázat jelentős csökkentése a napi munkafolyamat megváltoztatása nélkül.
Jogi iroda esettanulmánya
Egy jogi iroda alkalmazottai a Claude-ot használták szerződéses feljegyzések elkészítéséhez. Módszerük: szerződésszakaszok másolása, beillesztés a Claude-ba, összefoglalás kérése.
A Chrome-bővítmény használata előtt — első 6 hónap:
- Az ellenőrzés során 3 ügyféladata-incidens derült ki.
- Minden incidens: egy ügyfélnév és egy ügyszám jelent meg az üzenetben.
- Mind a 3 véletlenszerű volt.
A Chrome-bővítmény használata után — következő 6 hónap:
- Nulla ügyféladata-incidens.
- A személyzet valós idejű figyelmeztetést kapott, amikor ügyféladatokat tartalmazó szakaszokat illesztett be.
- Egy kattintással a „Johnson Controls Matter 2024-0347” helyett „[PERSON_1] Matter [REFERENCE_1]” jelent meg.
- A módszer ugyanaz maradt.
Az ügyvezető partner elmondta: „Munkatársaink ismerték a szabályzatot a bővítmény előtt is. A bővítmény tette a megfelelőséget a könnyebb utat.”
Lássa, hogyan kezelték ezt más cégek a esettanulmányokban. Tekintse át az ellenőrzéseket a biztonsági áttekintőben.
GDPR-nyilvántartások a megfelelési csapatok számára
A böngészőalapú AI-elfedést alkalmazó cégeknek ezt technikai ellenőrzésként kell dokumentálniuk.
Adatkezelési nyilvántartások (ROPA): Adja meg, hogy az AI-üzenetek ügyféloldali elfedésen mennek keresztül, mielőtt szállítókhoz jutnak. Sorolja fel az entitástípusokat, a motorverziót és a telepítési naplókat bizonyítékként.
Adatfeldolgozói szerződések: Ha személyes adatok nem jutnak el az AI-szállítóhoz, az adatfeldolgozói szerződési kötelezettségek egyszerűek. A tárolt személyes adatok soha nem hagyják el a rendszert.
Auditnaplók: A bővítmény naplói rögzítik az entitások számát munkamenetenként, az elfedési arányt és az entitástípusokat mennyiség szerint. Ezek a mutatók bekerülnek a megfelelési jelentésekbe.
Tekintse át a GDPR-szabályokat az AI-eszközöknél a jogi megfelelési útmutatóban és a szószedetben. A leggyakoribb kérdések a GYIK-ben találhatók.
Összefoglalás
A Samsung-eset megmutatta, hogy az AI-szivárgások gyorsabban történnek, mint ahogy bármely utólagos kontroll reagálni tud. A Cyberhaven-tanulmány számot adott ehhez: az üzenetek 11%-a, naponta sokszor, minden munkavállalónál.
A küldés előtti valós idejű elfedés a gyökérokot orvosolja. Ha a személyes adat soha nem jut el az AI-hoz, nincs mit észlelni, naplózni vagy megtisztítani. A munkavállalók megtartják AI-eszközeiket. A vállalatok megőrzik megfelelési státuszukat.
Az észlelés azt mondja meg, mikor nem sikerült a megelőzés. Az AI-adatszivárgásoknál a kudarc ára — bírságok, hírnévkárosodás, bizalomvesztés — igazolja az előzetes megelőzést.
Tekintse meg a díjszabást cége számára. Olvassa el az alapítói nyilatkozatot, amely elmagyarázza, miért a megelőzés-első a tervezési alapelvünk.
Források
- Cyberhaven: AI Data Exposure Study 2025 — cyberhaven.com.
- Samsung ChatGPT adatszivárgás, 2023. március — Bloomberg.
- GDPR 4. és 32. cikk: Személyes adatok és technikai intézkedések — gdpr-info.eu.