anonym.legal

By · Last updated 2026-06-05

Назад към блогаСигурност на AI

Защита от изтичане на лични данни чрез ИИ в реално време

Когато служител въведе клиентско име в ChatGPT, данните напускат организационния контрол мигновено. Последващият DLP не може да върне нещата назад.

June 5, 20267 мин. четене
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

Защита от изтичане на лични данни чрез ИИ в реално време: спиране на течовете преди да са се случили

Актуализирано за 2026 г.

През март 2023 г. инженер от Samsung постави изходен код в ChatGPT. Кодът напусна контрола на Samsung мигновено. Нито един инструмент не го улови навреме. Постфактум мерките за сигурност не могат да спрат изтичането на данни чрез ИИ. Това събитие го доказа.

Инструментите за засичане ви казват какво се е случило след факта. Проверките на журнали, DLP за крайни точки и одитните журнали работят именно по този начин. При течовете чрез ИИ, знанието след факта е твърде закъсняло. Данните вече са достигнали до ИИ модела.

Мащабът на проблема

Проучване на Cyberhaven от 2025 г. разглежда как компаниите използват ИИ. Констатациите са поразителни.

  • 11% от всички подкани в ChatGPT съдържат лични или чувствителни данни.
  • Средният служител използва ИИ инструменти 14 пъти дневно.
  • Служителите с интензивно ползване взаимодействат 30 до 50 пъти дневно.
  • При 11%, това означава 3 до 5 изпращания на чувствителна информация на служител на ден.

В компания с 500 активни потребители на ИИ, това се натрупва до над 2 000 изпращания на чувствителна информация дневно. Всяко от тях може да представлява нарушение по член 83 от GDPR. Рискът не е само правен. Репутацията и доверието също са застрашени.

Чести видове чувствително съдържание в подканите към ИИ включват следното.

  • Имена и данни за контакт на клиенти.
  • Номера на сметки и платежни записи.
  • Медицински бележки от здравни служители.
  • Данни по дела от адвокати.
  • Бележки от HR екипи за служители.
  • Вътрешни приходни или търговски прогнози.

Проучването не разграничава умишленото от случайното споделяне. И двете създават същия правен риск. Служител, който забравя да премахне клиентско име, причинява същото нарушение като този, който игнорира правилото. Намерението не променя резултата.

Защо засичането е недостатъчно

Мрежовите проверки не могат да четат HTTPS трафик без TLS блокиране. TLS блокирането добавя натоварване и повдига опасения за поверителността. Съвременните браузъри често го отхвърлят.

DLP агентите за крайни точки наблюдават клипборда и въведения текст. Но имат закъснение. До момента, в който агентът маркира шаблон, подканата може вече да е изпратена.

Одитните журнали на доставчика записват какво е споделено след като вече е споделено. Помагат при реакция. Не спират течовете.

Обучението на персонала е политика, не контрол. Проучването на Cyberhaven показва, че 11% от подканите все още съдържат чувствително съдържание при компании с ясни политики. Обучението не спира случайното споделяне или пропуски по средата на задача.

Блокирането на ИИ инструменти премахва ползите от тях. Служителите тогава използват лични устройства или акаунти. Това поставя работата извън всякакъв надзор.

Нито един от тези методи не спира чувствителното съдържание от достигане до ИИ системи в реално време.

Превенция в точката на въвеждане

Единствената сигурна защита е маскиране преди изпращането на подканата. Клиентско име, заменено с [PERSON_1] преди да напусне браузъра, никога не се вижда от ИИ модела.

Ето как работи вграденото маскиране.

  1. Служител въвежда клиентски имейл в Claude или ChatGPT.
  2. Разширението за браузър открива лични данни в реално време.
  3. Субектите се маркират с типови обозначения: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
  4. Служителят преглежда маркираните елементи.
  5. С едно кликване всички субекти се заменят с токени.
  6. Маскираната подкана се изпраща.

ИИ получава подкана от вида: "Клиент [PERSON_1] на адрес [EMAIL_1] има акаунт [ACCOUNT_1]."

ИИ обработва заявката. Никога не вижда реални имена или номера. Служителят познава реалния клиент от контекста.

Този подход има ясни предимства.

  • Личните данни не попадат в външни ИИ системи.
  • Клиентски детайли не се добавят към наборите за обучение на ИИ.
  • Служителите запазват достъп до ИИ инструменти. Производителността остава висока.

Той не спира умишленото споделяне, ако служител заобиколи инструмента. Качването на файлове изисква отделен работен процес. Никой контрол не е перфектен. Но вграденото маскиране премахва случайната група. Тя съставлява по-голямата част от инцидентите. Резултатът е значителен спад в риска без промяна в ежедневния работен процес.

Казус от адвокатска кантора

Служителите на адвокатска кантора използвали Claude за изготвяне на бележки по договори. Методът: копиране на раздели от договори, поставянето им в Claude, искане на резюме.

Преди използването на Chrome Extension - първите 6 месеца:

  • 3 инцидента с клиентски данни, открити по време на преглед.
  • Всеки инцидент: клиентско име плюс референтен номер по дело, появили се в подканата.
  • И трите са случайни.

След използването на Chrome Extension - следващите 6 месеца:

  • Нула инцидента с клиентски данни.
  • Служителите получавали предупреждения в реално време при поставяне на раздели с клиентски имена.
  • С едно кликване "Johnson Controls Matter 2024-0347" се заменяше с "[PERSON_1] Matter [REFERENCE_1]".
  • Методът оставал същият.

Управляващият съдружник заявил: "Нашите служители знаеха политиката преди добавката. Добавката направи спазването лесния избор."

Вижте как другите кантори се справят с това в нашите казуси. Прегледайте контролите в прегледа на сигурността.

GDPR записи за екипите по съответствие

Компаниите, използващи браузърно базирано ИИ маскиране, трябва да го документират като техническа мярка за контрол.

Записи за дейностите по обработване (ROPA): Посочете, че ИИ подканите преминават през маскиране от страна на клиента преди достигане до доставчиците. Изброете типовете субекти, версията на машината и журналите за внедряване като доказателство.

Споразумения с обработващите данни: Когато никакви лични данни не достигат до ИИ доставчика, задълженията по DPA са опростени. Личните данни, които притежавате, никога не напускат вашата система.

Одитни журнали: Журналите на добавката улавят броя субекти на сесия, степента на маскиране и типовете субекти по обем. Тези показатели захранват докладите за съответствие.

Прегледайте правилата на GDPR за ИИ инструменти в нашия наръчник за правно съответствие и речник. Чести въпроси са в нашия FAQ.

Заключение

Инцидентът Samsung показа, че течовете чрез ИИ се случват по-бързо, отколкото всеки постфактум контрол може да реагира. Проучването на Cyberhaven го поставя в числа: 11% от подканите, многократно на служител, всеки ден.

Маскирането в реално време преди изпращане отстранява основната причина. Когато личните данни никога не достигат до ИИ, няма какво да бъде откривано, записвано или почиствано. Служителите запазват своите ИИ инструменти. Компаниите запазват статуса си на съответствие.

Засичането ви казва кога превенцията е провалена. За течовете на данни чрез ИИ, цената на провала - глоби, увредена репутация, загуба на доверие - оправдава първо превенцията.

Разгледайте ценообразуването за вашата компания. Прочетете нашата декларация на основателя защо превенцията на първо място е нашият основен принцип на проектиране.

Източници

  • Cyberhaven: Проучване за излагането на данни чрез ИИ 2025 - cyberhaven.com.
  • Пробив на данни на Samsung ChatGPT, март 2023 - Bloomberg.
  • GDPR членове 4 и 32: Лични данни и технически мерки - gdpr-info.eu.

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.