By · Last updated 2026-06-05

Povratak na BlogSigurnost AI-a

Sprecavanje curenja osobnih podataka u AI alatima u stvarnom vremenu

Kada zaposlenik utipka ime kupca u ChatGPT, podaci odmah napustaju organizaciju. Naknadni DLP ne moze ponistiti ono sto je vec poslano.

June 5, 20267 min čitanja
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

Sprecavanje curenja osobnih podataka u AI alatima u stvarnom vremenu

Azurirano za 2026.

U ozujku 2023. inzenjer tvrtke Samsung zalijepljao je izvorni kod u ChatGPT. Kod je odmah napustio Samsungove sustave. Nijedan alat to nije uhvatio na vrijeme. Ovaj je dogadaj dokazao da naknadne sigurnosne kontrole ne mogu zaustaviti curenje podataka u AI alatima.

Alati za detekciju govore vam sto se dogodilo nakon cinjenice. Provjere zapisnika, endpoint DLP i revizijski tragovi funkcioniraju na taj nacin. Za curenja u AI alatima, nakon cinjenice je prekasno. Podaci su vec dosli do AI modela.

Razmjer problema

Istrazivanje tvrtke Cyberhaven iz 2025. analiziralo je nacin na koji tvrtke koriste AI. Nalazi su bili zabrinjavajuci.

  • 11% svih upita u ChatGPT-u sadrzi privatne ili osjetljive podatke.
  • Prosjecni zaposlenik koristi AI alate 14 puta dnevno.
  • Visoko aktivni zaposlenici komuniciraju 30 do 50 puta dnevno.
  • Pri stopi od 11%, to znaci 3 do 5 osjetljivih slanja po zaposleniku dnevno.

U tvrtki s 500 aktivnih zaposlenika, to se zbraja na vise od 2.000 osjetljivih slanja dnevno. Svako moze biti povreda GDPR clanka 83. Rizik nije samo pravni. U pitanju su i povjerenje i reputacija.

Uobicajene vrste osjetljivog sadrzaja u AI upitima ukljucuju sljedece:

  • Imena kupaca i kontaktni podaci.
  • Brojevi racuna i podaci o placanjima.
  • Medicinski zapisi zdravstvenih radnika.
  • Pojedinosti predmeta od odvjetnika.
  • Biljeski o ocjenjivanju zaposlenika iz HR timova.
  • Interni prihodi ili prodajne projekcije.

Istrazivanje ne razlikuje namjerno od slucajnog dijeljenja. Oba stvaraju isti pravni rizik. Zaposlenik koji zaboravi ukloniti ime klijenta uzrokuje isti prekrsaj kao onaj koji ignorira pravilo. Namjera ne mijenja ishod.

Zasto detekcija ne funkcionira

Mrezne provjere ne mogu citati HTTPS promet bez TLS blokiranja. TLS blokiranje dodaje rezijentan i pokrenuje probleme s privatnoscu. Moderni preglednici ga cesto odbijaju.

Endpoint DLP agenti prate meduspremnik i unos tipkovnicom. Ali imaju kasnjenje. Do trenutka kada agent oznaci obrazac, upit mozda je vec poslan.

Revizijski zapisnici dobavljaca biljeze sto je podijeljeno nakon sto je podijeljeno. Pomazu s odgovorom. Ne zaustavljaju curenje.

Obuka zaposlenika je politika, a ne kontrola. Cyberhavenstudy pokazuje da 11% upita i dalje sadrzi osjetljiv sadrzaj u tvrtkama s jasnim pravilnicima. Obuka ne zaustavlja slucajno dijeljenje ili prekide usred zadatka.

Blokiranje AI alata uklanja produktivne dobitke. Zaposlenici tada koriste osobne uredaje ili racune. To stavlja posao izvan svake kontrole.

Nijedno od ovih metoda ne sprecava osjetljiv sadrzaj da u stvarnom vremenu dosegne AI sustave.

Sprecavanje na tocki unosa

Jedina sigurna obrana je maskiranje prije slanja upita. Ime kupca zamijenjeno s [PERSON_1] prije nego sto napusti preglednik nikada nije vidljivo AI modelu.

Evo kako inline maskiranje funkcionira:

  1. Zaposlenik upisuje e-mail adresu kupca u Claude ili ChatGPT.
  2. Dodatak preglednika otkriva osobne podatke u stvarnom vremenu.
  3. Entiteti su oznaceni oznakama tipa: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
  4. Zaposlenik pregledava oznacene stavke.
  5. Jedan klik zamjenjuje sve entitete tokenima.
  6. Maskirani upit se salje.

AI dobiva upit ovako: "Kupac [PERSON_1] na [EMAIL_1] ima racun [ACCOUNT_1]."

AI obradjuje zahtjev. Nikada ne vidi prava imena ili brojeve. Zaposlenik zna stvarnog kupca iz konteksta.

Ovaj pristup ima jasne prednosti:

  • Osobni podaci ostaju izvan vanjskih AI sustava.
  • Podaci o kupcima ne dodaju se u skupove za trening AI-ja.
  • Zaposlenici zadrzavaju pristup AI alatima. Produktivnost ostaje visoka.

Ne sprecava namjerno dijeljenje ako zaposlenik zaobidze alat. Ucitavanja datoteka trebaju zasebni tijek rada. Nijedna kontrola nije savrsena. Ali inline maskiranje uklanja skupinu slucajnih prekrsaja. Ta skupina cini vecinu incidenata. Rezultat je znacajno smanjenje rizika bez promjene svakodnevnog rada.

Studija slucaja: odvjetnicka tvrtka

Zaposlenici odvjetnicke tvrtke koristili su Claude za sastavljanje biljezbr ugovora. Metoda: kopiranje dijelova ugovora, lijepljenje u Claude, trazenje sazetka.

Prije koristenja Chrome prosirenja - prvih 6 mjeseci:

  • 3 incidenta s podacima klijenata otkrivena tijekom pregleda.
  • Svaki incident: ime klijenta i referentni broj predmeta pojavili su se u upitu.
  • Sva 3 bila su slucajna.

Nakon koristenja Chrome prosirenja - iducih 6 mjeseci:

  • Nula incidenata s podacima klijenata.
  • Zaposlenici su primali obavijesti u stvarnom vremenu pri lijepljenju dijelova s imenima klijenata.
  • Jedan klik zamjenjivao je "Johnson Controls Predmet 2024-0347" s "[PERSON_1] Predmet [REFERENCE_1]".
  • Metoda je ostala ista.

Glavni odvjetnik rekao je: "Nasi zaposlenici su znali pravilnik i prije dodatka. Dodatak je ucinio uskladjenost laksim putem."

Pogledajte kako su druge tvrtke rijesile ovo u nasim studijama slucaja. Pregledajte kontrole u sigurnosnom pregledu.

GDPR zapisi za timove za uskladjenost

Tvrtke koje koriste maskiranje AI-ja temeljeno na pregledniku moraju to dokumentirati kao tehnicku kontrolu.

Zapisi o obradi (ROPA): Navedite da AI upiti prolaze kroz maskiranje na strani klijenta prije nego sto dosegnu dobavljace. Navedite vrste entiteta, verziju mehanizma i evidenciju implementacije kao dokaz.

Ugovori o obradi podataka: Kada osobni podaci ne dostignu AI dobavljaca, obveze ugovora o obradi podataka su jednostavne. Osobni podaci koje cuvate nikada ne napustaju vas sustav.

Revizijski zapisnici: Zapisnici dodataka biljeze broj entiteta po sesiji, stopu maskiranja i vrste entiteta po volumenu. Ove metrike ulaze u izvjesca o uskladjenosti.

Pregledajte GDPR pravila za AI alate u nasem pravnom vodivu za uskladjenost i rjecniku. Uobicajena pitanja nalaze se u nasim FAQ-u.

Zakljucak

Samsungov incident pokazao je da se curenje u AI alatima dogadja brze nego sto ikakva naknadna kontrola moze reagirati. Cyberhaven studija dala je broj: 11% upita, vise puta po zaposleniku, svaki dan.

Maskiranje u stvarnom vremenu prije slanja rjesava temeljni uzrok. Kada osobni podaci nikada ne dostignu AI, nema nicega sto treba detektirati, evidentirati ili popraviti. Zaposlenici zadrzavaju AI alate. Tvrtke zadrzavaju status uskladjenosti.

Detekcija govori vam kada je sprecavanje propalo. Za curenja u AI alatima, troskovi propusta - kazne, steta reputaciji, gubitak povjerenja - opravdavaju sprecavanje kao prioritet.

Istrazite cijene za vasu tvrtku. Procitajte nasu izjavu osnivaca o tome zasto je sprecavanje na prvom mjestu nas temeljni princip dizajna.

Izvori

  • Cyberhaven: AI Data Exposure Study 2025 - cyberhaven.com.
  • Samsung ChatGPT Data Breach, ozujak 2023. - Bloomberg.
  • GDPR clanci 4 i 32: Osobni podaci i tehnicke mjere - gdpr-info.eu.

Spremni za zaštitu vaših podataka?

Započnite anonimizaciju PII-a s 285+ vrsta entiteta na 48 jezika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.