Prevencia PII v reálnom case: Zastavenie úniku dát z AI skôr, ako k nemu dôjde
Aktualizované pre rok 2026.
V marci 2023 jeden inžinier zo Samsungu vložil zdrojový kód do ChatGPT. Kód okamžite opustil kontrolu Samsungu. Žiadny nástroj ho nezachytil vcas. Retroaktívne bezpecnostné opatrenia nemôžu zastaví únik dát z AI. Táto udalos to jasne dokázala.
Detekné nástroje vám povedia, co sa stalo po skutonosti. Kontrola logov, DLP na koncových bodoch a audit logy fungujú práve takto. Pri úniku z AI je "po skutonosti" príliš neskoro. Dáta sa už dostali k modelu AI.
Rozsah problému
Stúdia Cyberhaven z roku 2025 skúmala, ako firmy používajú AI. Výsledky boli zarážajúce.
- 11 % všetkých promptov ChatGPT obsahuje súkromné alebo citlivé dáta.
- Priemerný pracovník používa nástroje AI 14-krát denne.
- Zamestnanci s vysokým využitím ich používajú 30 až 50-krát denne.
- Pri 11 % to znamená 3 až 5 citlivých odoslaní na pracovníka denne.
Vo firme s 500 pracovníkmi s vysokým využitím to predstavuje viac ako 2 000 citlivých odoslaní denne. Každé z nich môže by porušenie podla GDPR clanok 83. Riziko nie je len právne. Na konu sú aj dôvera a reputácia.
Medzi bežné typy citlivého obsahu v AI promptoch patria tieto.
- Mená zákazníkov a kontaktné údaje.
- Císla úctov a platobné záznamy.
- Zdravotné záznamy od zdravotníckych pracovníkov.
- Podrobnosti prípadov od právnikov.
- Poznámky k hodnoteniam od HR tímov.
- Interné príjmové alebo predajné projekcie.
Stúdia nerozlišuje zámerné od neúmyselného zdielania. Oboje vytvára rovnaké právne riziko. Pracovník, ktorý zabudne odstrání meno klienta, spôsobuje rovnaké porušenie ako ten, kto pravidlo ignoruje. Zámer nemení výsledok.
Preco detekcia nestací
Sieové kontroly nedokážu cíta prevádzku HTTPS bez blokovania TLS. Blokovanie TLS pridáva réžiu a vyvoláva obavy o súkromie. Moderné prehliadace ho casto odmietajú.
Endpoint DLP agenti sledujú vstup zo schránky a klávesnice. Ale majú oneskorenie. Kým agent signalizuje vzor, prompt môže by už odoslaný.
Audit logy dodávatelov zaznamenávajú, co bolo zdielané, až po tom, ako to bolo zdielané. Pomáhajú pri reakcii. Úniky nezastavujú.
Školenie zamestnancov je politika, nie kontrola. Štúdia Cyberhaven ukazuje, že 11 % promptov stále obsahuje citlivý obsah vo firmách s jasnými politikami. Školenie nezastaví náhodné zdielanie ani výpadky pozornosti pocas práce.
Blokovanie nástrojov AI odstrauje prínosy. Pracovníci potom používajú osobné zariadenia alebo ucty. To umiestuje prácu mimo akéhokolvek dohadu.
Žiadna z týchto metód nezabrauje citlivému obsahu v reálnom case dos do systémov AI.
Prevencia v mieste vstupu
Jediná bezpecná obrana je maskovanie pred odoslaním promptu. Meno zákazníka nahradené za [PERSON_1] skôr, ako opustí prehliadac, model AI nikdy neuvidí.
Takto funguje inline maskovanie.
- Pracovník napíše e-mail zákazníka do Claude alebo ChatGPT.
- Doplnok prehliadaca detekuje osobné dáta v reálnom case.
- Entity sú oznacené typovými nálepkami: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
- Pracovník skontroluje oznacené položky.
- Jedným kliknutím sa všetky entity nahradia tokenmi.
- Maskovaný prompt sa odošle.
AI dostane prompt takto: "Zákazník [PERSON_1] na adrese [EMAIL_1] má úcet [ACCOUNT_1]."
AI spracuje požiadavku. Nikdy nevidí skutocné mená ani císla. Pracovník pozná skutocného zákazníka z kontextu.
Tento prístup má jasné výhody.
- Osobné dáta zostávajú mimo externých systémov AI.
- Údaje zákazníkov sa nedostávajú do tréningových sád AI.
- Pracovníci si zachovávajú prístup k nástrojom AI. Výkon zostáva vysoký.
Nezabrauje zámernej zdielaní, ak pracovník nástroj obíde. Nahrávanie súborov vyžaduje samostatný pracovný postup. Žiadna kontrola nie je dokonalá. Inline maskovanie však odstrauje skupinu náhodných prípadov. Táto skupina tvorí väcšinu incidentov. Výsledkom je výrazné zníženie rizika bez zmeny každodenného pracovného postupu.
Prípadová štúdia z právnickej kancelárie
Zamestnanci právnickej kancelárie používali Claude na vypracovanie poznámok k zmluvám. Ich postup: kopírovat casti zmluvy, vloži do Claude, požiada o zhrnutie.
Pred používaním rozšírenia Chrome - prvých 6 mesiacov:
- 3 incidenty s dátami klientov odhalené pocas preskúmania.
- Každý incident: meno klienta plus referenné císlo prípadu sa objavili v prompte.
- Všetky 3 boli náhodné.
Po používaní rozšírenia Chrome - nasledujúcich 6 mesiacov:
- Nula incidentov s dátami klientov.
- Zamestnanci dostávali upozornenia v reálnom case pri vkladaní castí s menami klientov.
- Jedným kliknutím sa nahradilo "Johnson Controls Matter 2024-0347" za "[PERSON_1] Matter [REFERENCE_1]."
- Metóda zostala rovnaká.
Vedúci partner uviedol: "Naši zamestnanci poznali politiku pred doplnkom. Doplnok urobil zo súladu tú lahšiu cestu."
Pozrite si, ako to riešili iné firmy, v našich prípadových štúdiách. Preskúmajte kontroly v prehlade bezpecnosti.
Záznamy GDPR pre compliance tímy
Firmy používajúce maskovanie AI na úrovni prehliadaca to musia zdokumentova ako technickú kontrolu.
Záznamy o spracovaní (ROPA): Uvedte, že prompty AI prechádzajú cez maskovanie na strane klienta pred dosiahnutím dodávatelov. Uvedte typy entít, verziu enginu a logy nasadenia ako dôkaz.
Dohody o spracovaní dát: Ked žiadne osobné dáta nedosiahnu dodávatela AI, povinnosti DPA sú jednoduché. Osobné dáta, ktoré uchovávate, nikdy neopustia váš systém.
Audit logy: Logy doplnku zachytávajú pocet entít na reláciu, mieru maskovania a typy entít podla objemu. Tieto metriky napájajú compliance správy.
Pozrite si pravidlá GDPR pre nástroje AI v našom sprievodcovi právnym súladom a glosári. Bežné otázky sú v našich FAQ.
Záver
Incident so Samsungom ukázal, že úniky z AI sa dejú rýchlejšie, ako môže akákovek retroaktívna kontrola konova. Štúdia Cyberhaven to vyciferovala: 11 % promptov, mnohokrát na pracovníka, každý den.
Maskovanie v reálnom case pred odoslaním odstrauje základnú príinu. Ked osobné dáta nikdy nedosiahnu AI, nie je co detekvova, logova ani upratvova. Pracovníci si zachovávajú nástroje AI. Firmy si zachovávajú stav súladu.
Detekcia vám hovorí, ked prevencia zlyhala. Pri úniku dát z AI náklady na zlyhanie - pokuty, poškodenie reputácie, strata dôvery - odôvodujú prevnciu na prvom mieste.
Preskúmajte cenník pre vašu firmu. Precítajte si naše vyhlásenie zakladatea o tom, preco je prevencia na prvom mieste naším základným princípom dizajnu.
Zdroje
- Cyberhaven: AI Data Exposure Study 2025 - cyberhaven.com.
- Samsung ChatGPT Data Breach, March 2023 - Bloomberg.
- GDPR Articles 4 and 32: Personal data and technical measures - gdpr-info.eu.