Prevence PII v reálném čase: Zastavení úniků dat z AI ještě před jejich vznikem

Aktualizováno pro rok 2026.

V březnu 2023 vložil inženýr Samsungu zdrojový kód do ChatGPT. Kód okamžitě opustil kontrolu Samsungu. Žádný nástroj jej nestihl zachytit včas. Bezpečnostní kontroly po faktu nemohou úniky dat z AI zastavit. Tato jediná událost to dokázala.

Detekční nástroje vám říkají, co se stalo až po skutečnosti. Kontroly protokolů, endpoint DLP a auditní záznamy fungují právě tímto způsobem. U úniků z AI je ale „po skutečnosti” příliš pozdě. Data se již dostala k modelu AI.

Rozsah problému

Studie Cyberhaven z roku 2025 zkoumala, jak firmy využívají AI. Zjištění byla přesvědčivá.

11 % všech promptů ChatGPT obsahuje soukromá nebo citlivá data.
Průměrný pracovník využívá nástroje AI 14krát denně.
Intenzivní uživatelé interagují 30 až 50krát denně.
Při 11 % to znamená 3 až 5 citlivých odeslání na pracovníka denně.

Ve firmě s 500 intenzivními uživateli to odpovídá více než 2 000 citlivým odeslání denně. Každé z nich může být porušením článku 83 GDPR. Riziko není jen právní. V sázce je také důvěra a pověst.

Běžné typy citlivého obsahu v promptech AI zahrnují následující.

Jména zákazníků a jejich kontaktní údaje.
Čísla účtů a platební záznamy.
Zdravotní poznámky od zdravotnického personálu.
Podrobnosti případů od advokátů.
Poznámky k hodnocení zaměstnanců od HR týmů.
Interní příjmové nebo obchodní projekce.

Studie nerozděluje záměrné a náhodné sdílení. Obě kategorie vytvářejí stejné právní riziko. Pracovník, který zapomene odstranit jméno klienta, způsobuje stejný únik jako ten, kdo pravidlo ignoruje. Záměr výsledek nemění.

Proč detekce nestačí

Síťové kontroly nemohou číst HTTPS provoz bez TLS blokování. TLS blokování přidává zátěž a vyvolává obavy o soukromí. Moderní prohlížeče jej často odmítají.

Endpoint DLP agenti sledují vstup schránky a klávesnice. Ale mají zpoždění. V době, kdy agent označí vzor, může být prompt již odeslán.

Auditní záznamy od dodavatele zaznamenávají, co bylo sdíleno, až poté, co k tomu došlo. Pomáhají s reakcí. Úniky nezastavují.

Školení zaměstnanců je politikou, nikoli kontrolním mechanismem. Studie Cyberhaven ukazuje, že 11 % promptů stále obsahuje citlivý obsah i ve firmách s jasnými politikami. Školení náhodné sdílení ani dočasné výpadky pozornosti nezastavuje.

Blokování nástrojů AI odstraňuje přínosy výstupu. Pracovníci pak využívají osobní zařízení nebo účty. To přesouvá pracovní agendu mimo jakoukoli dohled.

Žádná z těchto metod nezastavuje citlivý obsah od dosažení systémů AI v reálném čase.

Prevence v místě vstupu

Jediná bezpečná obrana je maskování před odesláním promptu. Jméno zákazníka nahrazené tokenem [PERSON_1] ještě před opuštěním prohlížeče model AI nikdy neuvidí.

Takto funguje inline maskování.

Pracovník napíše e-mail zákazníka do Claude nebo ChatGPT.
Doplněk prohlížeče detekuje osobní data v reálném čase.
Entity jsou označeny typovými štítky: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
Pracovník zkontroluje označené položky.
Jedním klikem nahradí všechny entity tokeny.
Maskovaný prompt je odeslán.

AI obdrží prompt jako: „Zákazník [PERSON_1] na adrese [EMAIL_1] má účet [ACCOUNT_1].”

AI zpracuje požadavek. Nikdy neuvidí skutečná jména ani čísla. Pracovník zná skutečného zákazníka z kontextu.

Tento přístup přináší jasné výhody.

Osobní data zůstávají mimo externí systémy AI.
Údaje zákazníků nejsou přidávány do trénovacích sad AI.
Pracovníci si zachovávají přístup k nástrojům AI. Produktivita zůstává vysoká.

Nezastavuje záměrné sdílení, pokud pracovník nástroj obejde. Nahrávání souborů vyžaduje oddělený pracovní postup. Žádná kontrola není dokonalá. Inline maskování však eliminuje skupinu náhodných incidentů. Ta tvoří většinu případů. Výsledkem je výrazné snížení rizika bez změny každodenního pracovního postupu.

Případová studie advokátní kanceláře

Zaměstnanci advokátní kanceláře používali Claude k přípravě poznámek ke smlouvám. Jejich metoda: zkopírování části smlouvy, vložení do Claude, žádost o shrnutí.

Před použitím rozšíření pro Chrome — prvních 6 měsíců:

Při kontrole byly nalezeny 3 incidenty s daty klientů.
Každý incident: jméno klienta spolu s referenčním číslem případu v promptu.
Všechny 3 byly náhodné.

Po použití rozšíření pro Chrome — následujících 6 měsíců:

Nulový počet incidentů s daty klientů.
Zaměstnanci dostávali upozornění v reálném čase při vkládání sekcí s jmény klientů.
Jedním klikem bylo nahrazeno „Johnson Controls Matter 2024-0347” za „[PERSON_1] Matter [REFERENCE_1]”.
Metoda práce zůstala nezměněná.

Řídící partner uvedl: „Naši zaměstnanci znali politiku ještě před nasazením doplňku. Doplněk z dodržování předpisů udělal nejjednodušší cestu.”

Jak se s tímto problémem vypořádaly jiné firmy, viz naše případové studie. Kontrolní mechanismy najdete v přehledu bezpečnosti.

Firmy používající maskování AI na úrovni prohlížeče jej musí zdokumentovat jako technické opatření.

Záznamy o činnostech zpracování (ROPA): Uveďte, že prompty AI procházejí maskováním na straně klienta ještě před dosažením dodavatelů. Jako důkaz uveďte typy entit, verzi detekčního jádra a protokoly nasazení.

Smlouvy se zpracovateli dat: Pokud žádná osobní data nedosáhnou dodavatele AI, povinnosti DPA jsou jednoduché. Osobní data, která uchováváte, nikdy neopustí váš systém.

Auditní záznamy: Protokoly doplňku zachycují počet entit na relaci, míru maskování a typy entit podle objemu. Tyto metriky se promítají do compliance zpráv.

Pravidla GDPR pro nástroje AI najdete v našem průvodci právní shody a glosáři. Časté otázky jsou v naší sekci FAQ.

Závěr

Incident Samsungu ukázal, že úniky dat z AI se dějí rychleji, než může jakákoli následná kontrola zareagovat. Studie Cyberhaven to vyčíslila: 11 % promptů, mnohokrát na pracovníka, každý den.

Maskování v reálném čase před odesláním řeší kořenovou příčinu. Pokud osobní data nikdy nedosáhnou AI, není co detekovat, zaznamenávat ani opravovat. Pracovníci si zachovávají nástroje AI. Firmy si zachovávají status shody s předpisy.

Detekce vám říká, kdy prevence selhala. U úniků dat z AI náklady selhání — pokuty, poškození pověsti, ztráta důvěry — ospravedlňují přístup prevence na prvním místě.

Prohlédněte si ceník pro vaši firmu. Přečtěte si naše prohlášení zakladatele o tom, proč je přístup prevence na prvním místě naším základním designovým principem.

Zdroje

Cyberhaven: AI Data Exposure Study 2025 — cyberhaven.com.
Samsung ChatGPT Data Breach, March 2023 — Bloomberg.
GDPR Articles 4 and 32: Personal data and technical measures — gdpr-info.eu.

Související články

Bezpečnost AI

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.

Začít bezplatnou zkušební verzi Zobrazit funkce

Prevence PII v reálném čase pro úniky dat z AI

Prevence PII v reálném čase: Zastavení úniků dat z AI ještě před jejich vznikem

Rozsah problému

Proč detekce nestačí

Prevence v místě vstupu

Případová studie advokátní kanceláře

Závěr

Zdroje

Související články

AI Coding Assistants Leak Production PII

Internal Wiki PII: Confluence Customer Data

Screenshot PII: Leaks in Internal Tools

Připraveni chránit svá data?

Prevence PII v reálném čase pro úniky dat z AI

Prevence PII v reálném čase: Zastavení úniků dat z AI ještě před jejich vznikem

Rozsah problému

Proč detekce nestačí

Prevence v místě vstupu

Případová studie advokátní kanceláře

Záznamy GDPR pro compliance týmy

Závěr

Zdroje

Související články

AI Coding Assistants Leak Production PII

Internal Wiki PII: Confluence Customer Data

Screenshot PII: Leaks in Internal Tools

Připraveni chránit svá data?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow