By · Last updated 2026-06-05

Zpět na blogBezpečnost AI

Prevence PII v reálném čase pro úniky dat z AI

Když zaměstnanec napíše jméno zákazníka do ChatGPT, data okamžitě opustí kontrolu organizace. Následná DLP kontrola tuto situaci nenapraví.

June 5, 20267 min čtení
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

Prevence PII v reálném čase: Zastavení úniků dat z AI ještě před jejich vznikem

Aktualizováno pro rok 2026.

V březnu 2023 vložil inženýr Samsungu zdrojový kód do ChatGPT. Kód okamžitě opustil kontrolu Samsungu. Žádný nástroj jej nestihl zachytit včas. Bezpečnostní kontroly po faktu nemohou úniky dat z AI zastavit. Tato jediná událost to dokázala.

Detekční nástroje vám říkají, co se stalo až po skutečnosti. Kontroly protokolů, endpoint DLP a auditní záznamy fungují právě tímto způsobem. U úniků z AI je ale „po skutečnosti” příliš pozdě. Data se již dostala k modelu AI.

Rozsah problému

Studie Cyberhaven z roku 2025 zkoumala, jak firmy využívají AI. Zjištění byla přesvědčivá.

  • 11 % všech promptů ChatGPT obsahuje soukromá nebo citlivá data.
  • Průměrný pracovník využívá nástroje AI 14krát denně.
  • Intenzivní uživatelé interagují 30 až 50krát denně.
  • Při 11 % to znamená 3 až 5 citlivých odeslání na pracovníka denně.

Ve firmě s 500 intenzivními uživateli to odpovídá více než 2 000 citlivým odeslání denně. Každé z nich může být porušením článku 83 GDPR. Riziko není jen právní. V sázce je také důvěra a pověst.

Běžné typy citlivého obsahu v promptech AI zahrnují následující.

  • Jména zákazníků a jejich kontaktní údaje.
  • Čísla účtů a platební záznamy.
  • Zdravotní poznámky od zdravotnického personálu.
  • Podrobnosti případů od advokátů.
  • Poznámky k hodnocení zaměstnanců od HR týmů.
  • Interní příjmové nebo obchodní projekce.

Studie nerozděluje záměrné a náhodné sdílení. Obě kategorie vytvářejí stejné právní riziko. Pracovník, který zapomene odstranit jméno klienta, způsobuje stejný únik jako ten, kdo pravidlo ignoruje. Záměr výsledek nemění.

Proč detekce nestačí

Síťové kontroly nemohou číst HTTPS provoz bez TLS blokování. TLS blokování přidává zátěž a vyvolává obavy o soukromí. Moderní prohlížeče jej často odmítají.

Endpoint DLP agenti sledují vstup schránky a klávesnice. Ale mají zpoždění. V době, kdy agent označí vzor, může být prompt již odeslán.

Auditní záznamy od dodavatele zaznamenávají, co bylo sdíleno, až poté, co k tomu došlo. Pomáhají s reakcí. Úniky nezastavují.

Školení zaměstnanců je politikou, nikoli kontrolním mechanismem. Studie Cyberhaven ukazuje, že 11 % promptů stále obsahuje citlivý obsah i ve firmách s jasnými politikami. Školení náhodné sdílení ani dočasné výpadky pozornosti nezastavuje.

Blokování nástrojů AI odstraňuje přínosy výstupu. Pracovníci pak využívají osobní zařízení nebo účty. To přesouvá pracovní agendu mimo jakoukoli dohled.

Žádná z těchto metod nezastavuje citlivý obsah od dosažení systémů AI v reálném čase.

Prevence v místě vstupu

Jediná bezpečná obrana je maskování před odesláním promptu. Jméno zákazníka nahrazené tokenem [PERSON_1] ještě před opuštěním prohlížeče model AI nikdy neuvidí.

Takto funguje inline maskování.

  1. Pracovník napíše e-mail zákazníka do Claude nebo ChatGPT.
  2. Doplněk prohlížeče detekuje osobní data v reálném čase.
  3. Entity jsou označeny typovými štítky: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
  4. Pracovník zkontroluje označené položky.
  5. Jedním klikem nahradí všechny entity tokeny.
  6. Maskovaný prompt je odeslán.

AI obdrží prompt jako: „Zákazník [PERSON_1] na adrese [EMAIL_1] má účet [ACCOUNT_1].”

AI zpracuje požadavek. Nikdy neuvidí skutečná jména ani čísla. Pracovník zná skutečného zákazníka z kontextu.

Tento přístup přináší jasné výhody.

  • Osobní data zůstávají mimo externí systémy AI.
  • Údaje zákazníků nejsou přidávány do trénovacích sad AI.
  • Pracovníci si zachovávají přístup k nástrojům AI. Produktivita zůstává vysoká.

Nezastavuje záměrné sdílení, pokud pracovník nástroj obejde. Nahrávání souborů vyžaduje oddělený pracovní postup. Žádná kontrola není dokonalá. Inline maskování však eliminuje skupinu náhodných incidentů. Ta tvoří většinu případů. Výsledkem je výrazné snížení rizika bez změny každodenního pracovního postupu.

Případová studie advokátní kanceláře

Zaměstnanci advokátní kanceláře používali Claude k přípravě poznámek ke smlouvám. Jejich metoda: zkopírování části smlouvy, vložení do Claude, žádost o shrnutí.

Před použitím rozšíření pro Chrome — prvních 6 měsíců:

  • Při kontrole byly nalezeny 3 incidenty s daty klientů.
  • Každý incident: jméno klienta spolu s referenčním číslem případu v promptu.
  • Všechny 3 byly náhodné.

Po použití rozšíření pro Chrome — následujících 6 měsíců:

  • Nulový počet incidentů s daty klientů.
  • Zaměstnanci dostávali upozornění v reálném čase při vkládání sekcí s jmény klientů.
  • Jedním klikem bylo nahrazeno „Johnson Controls Matter 2024-0347” za „[PERSON_1] Matter [REFERENCE_1]”.
  • Metoda práce zůstala nezměněná.

Řídící partner uvedl: „Naši zaměstnanci znali politiku ještě před nasazením doplňku. Doplněk z dodržování předpisů udělal nejjednodušší cestu.”

Jak se s tímto problémem vypořádaly jiné firmy, viz naše případové studie. Kontrolní mechanismy najdete v přehledu bezpečnosti.

Záznamy GDPR pro compliance týmy

Firmy používající maskování AI na úrovni prohlížeče jej musí zdokumentovat jako technické opatření.

Záznamy o činnostech zpracování (ROPA): Uveďte, že prompty AI procházejí maskováním na straně klienta ještě před dosažením dodavatelů. Jako důkaz uveďte typy entit, verzi detekčního jádra a protokoly nasazení.

Smlouvy se zpracovateli dat: Pokud žádná osobní data nedosáhnou dodavatele AI, povinnosti DPA jsou jednoduché. Osobní data, která uchováváte, nikdy neopustí váš systém.

Auditní záznamy: Protokoly doplňku zachycují počet entit na relaci, míru maskování a typy entit podle objemu. Tyto metriky se promítají do compliance zpráv.

Pravidla GDPR pro nástroje AI najdete v našem průvodci právní shody a glosáři. Časté otázky jsou v naší sekci FAQ.

Závěr

Incident Samsungu ukázal, že úniky dat z AI se dějí rychleji, než může jakákoli následná kontrola zareagovat. Studie Cyberhaven to vyčíslila: 11 % promptů, mnohokrát na pracovníka, každý den.

Maskování v reálném čase před odesláním řeší kořenovou příčinu. Pokud osobní data nikdy nedosáhnou AI, není co detekovat, zaznamenávat ani opravovat. Pracovníci si zachovávají nástroje AI. Firmy si zachovávají status shody s předpisy.

Detekce vám říká, kdy prevence selhala. U úniků dat z AI náklady selhání — pokuty, poškození pověsti, ztráta důvěry — ospravedlňují přístup prevence na prvním místě.

Prohlédněte si ceník pro vaši firmu. Přečtěte si naše prohlášení zakladatele o tom, proč je přístup prevence na prvním místě naším základním designovým principem.

Zdroje

  • Cyberhaven: AI Data Exposure Study 2025 — cyberhaven.com.
  • Samsung ChatGPT Data Breach, March 2023 — Bloomberg.
  • GDPR Articles 4 and 32: Personal data and technical measures — gdpr-info.eu.

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.