By · Last updated 2026-06-05

Späť na blogBezpečnosť AI

Prevencia PII v reálnom case pri únikoch dát z AI

Ked zamestnanec napíše meno zákazníka do ChatGPT, dáta okamžite opustia kontrolu organizácie. Dodatocné DLP tento zvon nazaspat nezvoní.

June 5, 20267 min čítania
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

Prevencia PII v reálnom case: Zastavenie úniku dát z AI skôr, ako k nemu dôjde

Aktualizované pre rok 2026.

V marci 2023 jeden inžinier zo Samsungu vložil zdrojový kód do ChatGPT. Kód okamžite opustil kontrolu Samsungu. Žiadny nástroj ho nezachytil vcas. Retroaktívne bezpecnostné opatrenia nemôžu zastaví únik dát z AI. Táto udalos to jasne dokázala.

Detekné nástroje vám povedia, co sa stalo po skutonosti. Kontrola logov, DLP na koncových bodoch a audit logy fungujú práve takto. Pri úniku z AI je "po skutonosti" príliš neskoro. Dáta sa už dostali k modelu AI.

Rozsah problému

Stúdia Cyberhaven z roku 2025 skúmala, ako firmy používajú AI. Výsledky boli zarážajúce.

  • 11 % všetkých promptov ChatGPT obsahuje súkromné alebo citlivé dáta.
  • Priemerný pracovník používa nástroje AI 14-krát denne.
  • Zamestnanci s vysokým využitím ich používajú 30 až 50-krát denne.
  • Pri 11 % to znamená 3 až 5 citlivých odoslaní na pracovníka denne.

Vo firme s 500 pracovníkmi s vysokým využitím to predstavuje viac ako 2 000 citlivých odoslaní denne. Každé z nich môže by porušenie podla GDPR clanok 83. Riziko nie je len právne. Na konu sú aj dôvera a reputácia.

Medzi bežné typy citlivého obsahu v AI promptoch patria tieto.

  • Mená zákazníkov a kontaktné údaje.
  • Císla úctov a platobné záznamy.
  • Zdravotné záznamy od zdravotníckych pracovníkov.
  • Podrobnosti prípadov od právnikov.
  • Poznámky k hodnoteniam od HR tímov.
  • Interné príjmové alebo predajné projekcie.

Stúdia nerozlišuje zámerné od neúmyselného zdielania. Oboje vytvára rovnaké právne riziko. Pracovník, ktorý zabudne odstrání meno klienta, spôsobuje rovnaké porušenie ako ten, kto pravidlo ignoruje. Zámer nemení výsledok.

Preco detekcia nestací

Sieové kontroly nedokážu cíta prevádzku HTTPS bez blokovania TLS. Blokovanie TLS pridáva réžiu a vyvoláva obavy o súkromie. Moderné prehliadace ho casto odmietajú.

Endpoint DLP agenti sledujú vstup zo schránky a klávesnice. Ale majú oneskorenie. Kým agent signalizuje vzor, prompt môže by už odoslaný.

Audit logy dodávatelov zaznamenávajú, co bolo zdielané, až po tom, ako to bolo zdielané. Pomáhajú pri reakcii. Úniky nezastavujú.

Školenie zamestnancov je politika, nie kontrola. Štúdia Cyberhaven ukazuje, že 11 % promptov stále obsahuje citlivý obsah vo firmách s jasnými politikami. Školenie nezastaví náhodné zdielanie ani výpadky pozornosti pocas práce.

Blokovanie nástrojov AI odstrauje prínosy. Pracovníci potom používajú osobné zariadenia alebo ucty. To umiestuje prácu mimo akéhokolvek dohadu.

Žiadna z týchto metód nezabrauje citlivému obsahu v reálnom case dos do systémov AI.

Prevencia v mieste vstupu

Jediná bezpecná obrana je maskovanie pred odoslaním promptu. Meno zákazníka nahradené za [PERSON_1] skôr, ako opustí prehliadac, model AI nikdy neuvidí.

Takto funguje inline maskovanie.

  1. Pracovník napíše e-mail zákazníka do Claude alebo ChatGPT.
  2. Doplnok prehliadaca detekuje osobné dáta v reálnom case.
  3. Entity sú oznacené typovými nálepkami: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
  4. Pracovník skontroluje oznacené položky.
  5. Jedným kliknutím sa všetky entity nahradia tokenmi.
  6. Maskovaný prompt sa odošle.

AI dostane prompt takto: "Zákazník [PERSON_1] na adrese [EMAIL_1] má úcet [ACCOUNT_1]."

AI spracuje požiadavku. Nikdy nevidí skutocné mená ani císla. Pracovník pozná skutocného zákazníka z kontextu.

Tento prístup má jasné výhody.

  • Osobné dáta zostávajú mimo externých systémov AI.
  • Údaje zákazníkov sa nedostávajú do tréningových sád AI.
  • Pracovníci si zachovávajú prístup k nástrojom AI. Výkon zostáva vysoký.

Nezabrauje zámernej zdielaní, ak pracovník nástroj obíde. Nahrávanie súborov vyžaduje samostatný pracovný postup. Žiadna kontrola nie je dokonalá. Inline maskovanie však odstrauje skupinu náhodných prípadov. Táto skupina tvorí väcšinu incidentov. Výsledkom je výrazné zníženie rizika bez zmeny každodenného pracovného postupu.

Prípadová štúdia z právnickej kancelárie

Zamestnanci právnickej kancelárie používali Claude na vypracovanie poznámok k zmluvám. Ich postup: kopírovat casti zmluvy, vloži do Claude, požiada o zhrnutie.

Pred používaním rozšírenia Chrome - prvých 6 mesiacov:

  • 3 incidenty s dátami klientov odhalené pocas preskúmania.
  • Každý incident: meno klienta plus referenné císlo prípadu sa objavili v prompte.
  • Všetky 3 boli náhodné.

Po používaní rozšírenia Chrome - nasledujúcich 6 mesiacov:

  • Nula incidentov s dátami klientov.
  • Zamestnanci dostávali upozornenia v reálnom case pri vkladaní castí s menami klientov.
  • Jedným kliknutím sa nahradilo "Johnson Controls Matter 2024-0347" za "[PERSON_1] Matter [REFERENCE_1]."
  • Metóda zostala rovnaká.

Vedúci partner uviedol: "Naši zamestnanci poznali politiku pred doplnkom. Doplnok urobil zo súladu tú lahšiu cestu."

Pozrite si, ako to riešili iné firmy, v našich prípadových štúdiách. Preskúmajte kontroly v prehlade bezpecnosti.

Záznamy GDPR pre compliance tímy

Firmy používajúce maskovanie AI na úrovni prehliadaca to musia zdokumentova ako technickú kontrolu.

Záznamy o spracovaní (ROPA): Uvedte, že prompty AI prechádzajú cez maskovanie na strane klienta pred dosiahnutím dodávatelov. Uvedte typy entít, verziu enginu a logy nasadenia ako dôkaz.

Dohody o spracovaní dát: Ked žiadne osobné dáta nedosiahnu dodávatela AI, povinnosti DPA sú jednoduché. Osobné dáta, ktoré uchovávate, nikdy neopustia váš systém.

Audit logy: Logy doplnku zachytávajú pocet entít na reláciu, mieru maskovania a typy entít podla objemu. Tieto metriky napájajú compliance správy.

Pozrite si pravidlá GDPR pre nástroje AI v našom sprievodcovi právnym súladom a glosári. Bežné otázky sú v našich FAQ.

Záver

Incident so Samsungom ukázal, že úniky z AI sa dejú rýchlejšie, ako môže akákovek retroaktívna kontrola konova. Štúdia Cyberhaven to vyciferovala: 11 % promptov, mnohokrát na pracovníka, každý den.

Maskovanie v reálnom case pred odoslaním odstrauje základnú príinu. Ked osobné dáta nikdy nedosiahnu AI, nie je co detekvova, logova ani upratvova. Pracovníci si zachovávajú nástroje AI. Firmy si zachovávajú stav súladu.

Detekcia vám hovorí, ked prevencia zlyhala. Pri úniku dát z AI náklady na zlyhanie - pokuty, poškodenie reputácie, strata dôvery - odôvodujú prevnciu na prvom mieste.

Preskúmajte cenník pre vašu firmu. Precítajte si naše vyhlásenie zakladatea o tom, preco je prevencia na prvom mieste naším základným princípom dizajnu.

Zdroje

  • Cyberhaven: AI Data Exposure Study 2025 - cyberhaven.com.
  • Samsung ChatGPT Data Breach, March 2023 - Bloomberg.
  • GDPR Articles 4 and 32: Personal data and technical measures - gdpr-info.eu.

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.