Tagasi BlogisseAI Turvalisus

Vältimine vs. Avastamine: Miks reaalajaline...

Kui töötaja tippib kliendi nime ChatGPT, andmed lahkuvad organisatsiooni juhtimise reaalajasel. Post-hoc DLP ei saa jääva selle kampa suuruses.

April 21, 20267 min lugemist
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

Vältimine vs. Avastamine: Miks reaalajaline isikuandmete anonüümsus on ainuke tõhus kaitse vastu AI andmete lekked

Samsung ChatGPT juhtumit märts 2023 näidatakse fundamentaal piirangus post-hoc turvalisuse juhtimise: Samsung insener kleepis omavaldust lähtekoodina ChatGPT enne mis tahes jälgimise või vältimine süsteem võis interveneerida. Kood lahkus Samsung kontrollus ühe tipuga.

Omavalduse jälgimine, lõpp DLP ja pärast-fakti anonüümsus on avastamise tööriistadel. Nad ütlevad sulle mida juhtus pärast seda juhtus. AI andmete leketest, avastamine pärast saatmine on liiga hiline. Andmed juba töödeldes AI mudeligus, võimalikult kaasarvatud koolituse andmete, ja ei ole enam teie kontrolli.

Probleemi skaala

2025 Cyberhaven uuringus analüüsiti ettevõtte AI tööriistade kasutamine tuhandetes organisatsioonides:

  • 11% kõigist ChatGPT viipeid sisaldavad konfidentsiaalset või isikutandmeid
  • Keskmine töötaja suhtleb AI tööriistadega 14 korda päevas
  • Kõrge kasutuse töötajad (juristid, analüütikud, klientide teenuse): 30-50 AI koostööd päevas
  • 11% sisaldab konfidentsiaalse andmete: 3-5 konfidentsiaalse saatmine per kõrge kasutuse töötaja päevas

500 kõrge kasutuse töötajad, see tähendab 1500-2500 konfidentsiaalse andmete saatmisi välisesse AI süsteemid päevas. Igal saatmisel on potentsiaalse GDPR artikli 83 rikkumise, kui isikuandmeid kaasarvatud.

Mida loetakse konfidentsiaalse või isikutandmeid AI viipedes:

  • Kliendi nimed, aadressid, telefoninumbrid
  • Sisemised projekti nimed ja rahaline andmete
  • Lähtekoodid ja arhitektuuri diagrammid
  • Lepingud termini ja sisemine hindamise
  • Tervishoiu kirjed ja patsiendi ajalugu
  • Õiguste teavet ja sisemised õigusstrateegia

Avastamise piiritus

Endpoint DLP tööriistaled saavad ühendamist lobu andmetele, mis ei lahku süsteemist:

DLP tööriista avastamise käivitus:

  1. Töötaja taistahtlikult tipib "Klient John Smith, sünni kuupäev 1985-05-12" ChatGPT-sse
  2. DLP tööriista registreerimise ja logid (mitu tundi pärast)
  3. DLP tööriista kasutab tööst või märgib süsteemi haldurile
  4. Haldur käsitlevad (järgmine päev)
  5. Andmed on juba OpenAI serverites ja potentsiaalse koolituse andmete

Avastamise hilistus riskide:

  • Väljastuspäevad: 6-24 tundi, mille ajal andmed on välises süsteemi
  • Käsitlevamise viivituus: halduri peab uurima ja kehtestada
  • Andmete kloonimine risk: juhuslik "Share" nupp edaspidi on juba jaganud andmete kollegiga, enne DLP andis märku

Reaalajaline vältimine lahendus

Prevention reaalajasel peatab andmete läbkülutus enne saatmista:

Arhitektuur:

  1. Töötaja taistahtlikult tipib kliendi nime Chrome'i laiendus
  2. Laiendus tuvastavad ja kustutatakse "Klient John Smith" → "Klient [CLIENT_NAME]"
  3. Töötaja näeb "Klient [CLIENT_NAME], sünni kuupäev [DATE]" enne ChatGPT viibi
  4. Anonüümsus andmeted saadetakse ChatGPT-sse
  5. ChatGPT vastus kuvatkse anonüümsus
  6. Laiendus de-anonüümsus vastus, kasutades seansi märgi mappingu
  7. Töötaja näeb tegelikud andmete, kuid ChatGPT ei näe

Tõhususe:

  • Reaalajaline: samalaadse käigus, mitte tundide hilisemalt
  • Automaaatne: töötaja ei pea käsitsi andmete redigeerida
  • Revesiibel: andmete de-anonüümsust võimalik seansis (märgi mappingu alus)

Reaalajaline implementeerimine

Chrome'i laiendus anonüümsus andmete AI sisse:

Samm 1: Tuvastamine

const anonymizer = new PII Anonymizer();
const input = document.querySelector('textarea[placeholder]').value;
const {anonymized, mappings} = anonymizer.process(input);

Samm 2: Saatmine Anonüümsus andmete saadetakse AI mudeligust, jättes tõesed andmeted browser mälu.

Samm 3: De-anonüümsus vastus

const response = await chatGPT.process(anonymized);
const deanonymized = anonymizer.deanonymize(response, mappings);

Samm 4: Kuva Töötaja näeb de-anonüümsus vastus.

GDPR nõuded ja reaalajaline vältimine

GDPR artikkel 32 nõuab "asjakohaseid tehnilisi kaitseid". Reaalajaline anonüümsus täidab selle nõude:

  1. Andmete teisenemine: Anonüümsus andmeid saadetakse välisele AI mudeligule, mitte tegelikud andmed
  2. Juurdepääsu juhtimine: AI mudel ei oma juurdepääsu tegelikule andmetele
  3. Auditeerimise jälgimine: Seansi märgi mappingu salvestatakse, näidates anonüümsus andmete kasutatud

Juhtumete näited, kus reaalajaline vältimine on juba teostatud:

  • anonym.legal Chrome'i laiendus (AI tööriistade jaoks)
  • anonym.legal Word Lisa (Office dokumentide jaoks)
  • anonym.legal Desktop rakendus (failide jaoks)

Allikad:

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.