By · Last updated 2026-06-05

Tagasi BlogisseAI Turvalisus

Reaalajas isikuandmete kaitse AI andmelekete vastu

Kui töötaja trükib kliendi nime ChatGPT-sse, lahkuvad andmed organisatsiooni kontrolli alt reaalajas. Tagantjärele DLP ei suuda seda tagasi pöörata.

June 5, 20267 min lugemist
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

Reaalajas isikuandmete kaitse: AI andmelekete peatamine enne, kui need juhtuvad.

Uuendatud 2026. aastaks.

Märtsis 2023 kleevis Samsung'i insener lähtekood ChatGPT-sse. Kood lahkus Samsung'i kontrolli alt kohe. Ükski vahend ei suutnud seda õigel ajal tabada. Tagantjärele turvakontrollid ei suuda AI andmelekeid peatada. See üks sündmus tõestas seda.

Tuvastamisvahendid ütlevad teile, mis juhtus pärast sündmust. Logide kontrollid, lõpp-punkti DLP ja auditeerimislogid töötavad kõik sel viisil. AI lekete puhul on pärast sündmust liiga hilja. Andmed on juba jõudnud AI mudelisse.

Probleemi ulatus

  1. aasta Cyberhaveni uuring vaatas, kuidas ettevõtted AI-d kasutavad. Tulemused olid silmatorkavad.
  • 11% kõigist ChatGPT päringutest sisaldab isiklikke või tundlikke andmeid.
  • Keskmine töötaja kasutab AI tööriistu 14 korda päevas.
  • Kõrge kasutusega töötajad suhtlevad 30 kuni 50 korda päevas.
  • 11% juures tähendab see 3 kuni 5 tundlikku saatmist töötaja kohta päevas.

Ettevõttes, kus on 500 kõrge kasutusega töötajat, lisandub see üle 2000 tundliku saatmise päevas. Iga saatmine võib olla GDPR artikkel 83 rikkumine. Risk ei ole ainult juriidiline. Ka usaldus ja maine on ohus.

Levinud tundliku sisu tüübid AI päringutes on järgmised.

  • Klientide nimed ja kontaktandmed.
  • Kontonumbrid ja maksedokumendid.
  • Tervishoiutöötajate meditsiinilised märkmed.
  • Juristide juhtumite üksikasjad.
  • Personaliosakonna töötajate hindamismärkused.
  • Sisemised tulu- või müügiprognoosid.

Uuring ei erista tahtlikku jagamist juhuslikust. Mõlemad loovad sama juriidilise riski. Töötaja, kes unustab kliendi nime eemaldada, põhjustab sama rikkumise nagu see, kes reeglit eirab. Kavatsus ei muuda tulemust.

Miks tuvastamine jääb puudulikuks

Võrgu kontrollid ei suuda HTTPS-liiklust lugeda ilma TLS-blokeerimiseta. TLS-blokeerimine lisab üldkulusid ja tekitab privaatsusprobleeme. Kaasaegsed brauserid lükkavad selle sageli tagasi.

Lõpp-punkti DLP agendid jälgivad lõikelaua ja klahvistiku sisendit. Kuid neil on viivitus. Selleks ajaks, kui agent mustri tuvastab, võib päring juba saadetud olla.

Tarnija auditeerimislogid registreerivad, mida jagati pärast jagamist. Need aitavad reageerida. Need ei peata lekete.

Töötajate koolitamine on poliitika, mitte kontroll. Cyberhaveni uuring näitab, et 11% päringutest sisaldab selge poliitikaga ettevõtetes endiselt tundlikku sisu. Koolitus ei peata juhuslikku jagamist ega töötamise keskel tekkivaid vahelejätmisi.

AI tööriistade blokeerimine eemaldab tootlikkuse kasud. Töötajad kasutavad siis isiklikke seadmeid või kontosid. See viib töö igasugusest järelevalvest välja.

Ükski neist meetoditest ei peata tundliku sisu jõudmist AI süsteemidesse reaalajas.

Kaitse sisestuspunktis

Ainus ohutu kaitse on maskeerimine enne päringu saatmist. Kliendi nimi, mis asendatakse [PERSON_1]-ga enne brauserist lahkumist, ei jõua kunagi AI mudelisse.

Siin on, kuidas reaalajas maskeerimine töötab.

  1. Töötaja trükib kliendi e-posti aadressi Claude'i või ChatGPT-sse.
  2. Brauseri lisandmoodul tuvastab isikuandmed reaalajas.
  3. Üksused märgistatakse tüübisiltidega: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
  4. Töötaja vaatab märgitud üksused üle.
  5. Ühe klõpsuga asendatakse kõik üksused tokenitega.
  6. Maskeeritud päring saadetakse.

AI saab sellise päringu: "Klient [PERSON_1] aadressil [EMAIL_1] omab kontot [ACCOUNT_1]."

AI täidab päringu. Ta ei näe kunagi pärisnimesid ega numbreid. Töötaja teab tegelikku klienti kontekstist.

Sel lähenemisel on selged eelised.

  • Isikuandmed ei jõua väliste AI süsteemidesse.
  • Kliendiandmeid ei lisata AI treeningkogumitesse.
  • Töötajad säilitavad juurdepääsu AI tööriistadele. Tootlikkus püsib kõrgel.

See ei peata tahtlikku jagamist, kui töötaja vahendist mööda läheb. Failide üleslaadimised vajavad eraldi töövoogu. Ükski kontroll ei ole täiuslik. Kuid reaalajas maskeerimine eemaldab juhusliku grupi. See grupp moodustab enamiku intsidentidest. Tulemuseks on suur riski langus ilma igapäevase töövoo muutuseta.

Advokaadibüroo näide

Advokaadibüroo töötajad kasutasid Claude'i lepingukirjete koostamiseks. Nende meetod: kopeerida lepingu lõigud, kleepida Claude'i, küsida kokkuvõtet.

Enne Chrome'i laienduse kasutamist - esimesed 6 kuud:

  • 3 kliendiandmete intsidenti avastati ülevaatuse käigus.
  • Iga intsidenti: kliendi nimi koos toimiku viitenumbriga ilmus päringus.
  • Kõik 3 olid juhuslikud.

Pärast Chrome'i laienduse kasutamist - järgmised 6 kuud:

  • Null kliendiandmete intsidenti.
  • Töötajad said reaalajas hoiatusi, kui kleepisid kliendi nimesid sisaldavaid lõike.
  • Ühe klõpsuga asendati "Johnson Controls Matter 2024-0347" tekstiga "[PERSON_1] Matter [REFERENCE_1]".
  • Meetod jäi samaks.

Juhtivpartner ütles: "Meie töötajad teadsid poliitikat enne lisandmoodulit. Lisandmoodul tegi vastavuse lihtsaimaks teeks."

Vaadake, kuidas teised ettevõtted selle lahendasid meie juhtumite ülevaates. Kontrollige kontrolle turvalisuse ülevaates.

GDPR dokumendid vastavusmeeskondadele

Brauseripõhist AI maskeerimist kasutavad ettevõtted peavad seda dokumenteerima tehnilise kontrollina.

Töötlemistegevuste register (ROPA): Märkige, et AI päringud läbivad kliendipoolse maskeerimise enne tarnijateni jõudmist. Loetlege üksuste tüübid, mootori versioon ja juurutamise logid tõendina.

Andmetöötluslepingud: Kui AI tarnijani ei jõua isikuandmeid, on andmetöötluslepingute kohustused lihtsad. Teie hoitavad isikuandmed ei lahku kunagi teie süsteemist.

Auditeerimislogid: Lisandmooduli logid jäädvustavad üksuste arvu seansi kohta, maskeerimismäära ja üksuste tüübid mahu järgi. Need mõõdikud toidavad vastavusaruandeid.

Vaadake GDPR reegleid AI tööriistade kohta meie juriidilise vastavuse juhendis ja sõnastikus. Levinud küsimused on meie KKK-s.

Kokkuvõte

Samsung'i intsident näitas, et AI lekked juhtuvad kiiremini, kui ükski tagantjärele kontroll suudab reageerida. Cyberhaveni uuring andis sellele numbri: 11% päringutest, mitu korda töötaja kohta, iga päev.

Realaajas maskeerimine enne saatmist lahendab algpõhjuse. Kui isikuandmed ei jõua kunagi AI-sse, pole midagi tuvastada, logida ega puhastada. Töötajad säilitavad oma AI tööriistad. Ettevõtted säilitavad oma vastavusstaatuse.

Tuvastamine ütleb teile, millal kaitse ebaõnnestus. AI andmelekete puhul - trahvid, maine kahju, usalduse kaotus - õigustab kaitse prioriteetsust.

Uuringe hinnakujundust oma ettevõtte jaoks. Lugege meie asutaja avaldust selle kohta, miks kaitse-esmane on meie põhikujunduspõhimõte.

Allikad

  • Cyberhaven: AI andmete avamise uuring 2025 - cyberhaven.com.
  • Samsung ChatGPT andmeleke, märts 2023 - Bloomberg.
  • GDPR artiklid 4 ja 32: Isikuandmed ja tehnilised meetmed - gdpr-info.eu.

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.