Защита от изтичане на лични данни чрез ИИ в реално време: спиране на течовете преди да са се случили

Актуализирано за 2026 г.

През март 2023 г. инженер от Samsung постави изходен код в ChatGPT. Кодът напусна контрола на Samsung мигновено. Нито един инструмент не го улови навреме. Постфактум мерките за сигурност не могат да спрат изтичането на данни чрез ИИ. Това събитие го доказа.

Инструментите за засичане ви казват какво се е случило след факта. Проверките на журнали, DLP за крайни точки и одитните журнали работят именно по този начин. При течовете чрез ИИ, знанието след факта е твърде закъсняло. Данните вече са достигнали до ИИ модела.

Мащабът на проблема

Проучване на Cyberhaven от 2025 г. разглежда как компаниите използват ИИ. Констатациите са поразителни.

11% от всички подкани в ChatGPT съдържат лични или чувствителни данни.
Средният служител използва ИИ инструменти 14 пъти дневно.
Служителите с интензивно ползване взаимодействат 30 до 50 пъти дневно.
При 11%, това означава 3 до 5 изпращания на чувствителна информация на служител на ден.

В компания с 500 активни потребители на ИИ, това се натрупва до над 2 000 изпращания на чувствителна информация дневно. Всяко от тях може да представлява нарушение по член 83 от GDPR. Рискът не е само правен. Репутацията и доверието също са застрашени.

Чести видове чувствително съдържание в подканите към ИИ включват следното.

Имена и данни за контакт на клиенти.
Номера на сметки и платежни записи.
Медицински бележки от здравни служители.
Данни по дела от адвокати.
Бележки от HR екипи за служители.
Вътрешни приходни или търговски прогнози.

Проучването не разграничава умишленото от случайното споделяне. И двете създават същия правен риск. Служител, който забравя да премахне клиентско име, причинява същото нарушение като този, който игнорира правилото. Намерението не променя резултата.

Защо засичането е недостатъчно

Мрежовите проверки не могат да четат HTTPS трафик без TLS блокиране. TLS блокирането добавя натоварване и повдига опасения за поверителността. Съвременните браузъри често го отхвърлят.

DLP агентите за крайни точки наблюдават клипборда и въведения текст. Но имат закъснение. До момента, в който агентът маркира шаблон, подканата може вече да е изпратена.

Одитните журнали на доставчика записват какво е споделено след като вече е споделено. Помагат при реакция. Не спират течовете.

Обучението на персонала е политика, не контрол. Проучването на Cyberhaven показва, че 11% от подканите все още съдържат чувствително съдържание при компании с ясни политики. Обучението не спира случайното споделяне или пропуски по средата на задача.

Блокирането на ИИ инструменти премахва ползите от тях. Служителите тогава използват лични устройства или акаунти. Това поставя работата извън всякакъв надзор.

Нито един от тези методи не спира чувствителното съдържание от достигане до ИИ системи в реално време.

Превенция в точката на въвеждане

Единствената сигурна защита е маскиране преди изпращането на подканата. Клиентско име, заменено с [PERSON_1] преди да напусне браузъра, никога не се вижда от ИИ модела.

Ето как работи вграденото маскиране.

Служител въвежда клиентски имейл в Claude или ChatGPT.
Разширението за браузър открива лични данни в реално време.
Субектите се маркират с типови обозначения: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
Служителят преглежда маркираните елементи.
С едно кликване всички субекти се заменят с токени.
Маскираната подкана се изпраща.

ИИ получава подкана от вида: "Клиент [PERSON_1] на адрес [EMAIL_1] има акаунт [ACCOUNT_1]."

ИИ обработва заявката. Никога не вижда реални имена или номера. Служителят познава реалния клиент от контекста.

Този подход има ясни предимства.

Личните данни не попадат в външни ИИ системи.
Клиентски детайли не се добавят към наборите за обучение на ИИ.
Служителите запазват достъп до ИИ инструменти. Производителността остава висока.

Той не спира умишленото споделяне, ако служител заобиколи инструмента. Качването на файлове изисква отделен работен процес. Никой контрол не е перфектен. Но вграденото маскиране премахва случайната група. Тя съставлява по-голямата част от инцидентите. Резултатът е значителен спад в риска без промяна в ежедневния работен процес.

Казус от адвокатска кантора

Служителите на адвокатска кантора използвали Claude за изготвяне на бележки по договори. Методът: копиране на раздели от договори, поставянето им в Claude, искане на резюме.

Преди използването на Chrome Extension - първите 6 месеца:

3 инцидента с клиентски данни, открити по време на преглед.
Всеки инцидент: клиентско име плюс референтен номер по дело, появили се в подканата.
И трите са случайни.

След използването на Chrome Extension - следващите 6 месеца:

Нула инцидента с клиентски данни.
Служителите получавали предупреждения в реално време при поставяне на раздели с клиентски имена.
С едно кликване "Johnson Controls Matter 2024-0347" се заменяше с "[PERSON_1] Matter [REFERENCE_1]".
Методът оставал същият.

Управляващият съдружник заявил: "Нашите служители знаеха политиката преди добавката. Добавката направи спазването лесния избор."

Вижте как другите кантори се справят с това в нашите казуси. Прегледайте контролите в прегледа на сигурността.

Компаниите, използващи браузърно базирано ИИ маскиране, трябва да го документират като техническа мярка за контрол.

Записи за дейностите по обработване (ROPA): Посочете, че ИИ подканите преминават през маскиране от страна на клиента преди достигане до доставчиците. Изброете типовете субекти, версията на машината и журналите за внедряване като доказателство.

Споразумения с обработващите данни: Когато никакви лични данни не достигат до ИИ доставчика, задълженията по DPA са опростени. Личните данни, които притежавате, никога не напускат вашата система.

Одитни журнали: Журналите на добавката улавят броя субекти на сесия, степента на маскиране и типовете субекти по обем. Тези показатели захранват докладите за съответствие.

Прегледайте правилата на GDPR за ИИ инструменти в нашия наръчник за правно съответствие и речник. Чести въпроси са в нашия FAQ.

Заключение

Инцидентът Samsung показа, че течовете чрез ИИ се случват по-бързо, отколкото всеки постфактум контрол може да реагира. Проучването на Cyberhaven го поставя в числа: 11% от подканите, многократно на служител, всеки ден.

Маскирането в реално време преди изпращане отстранява основната причина. Когато личните данни никога не достигат до ИИ, няма какво да бъде откривано, записвано или почиствано. Служителите запазват своите ИИ инструменти. Компаниите запазват статуса си на съответствие.

Засичането ви казва кога превенцията е провалена. За течовете на данни чрез ИИ, цената на провала - глоби, увредена репутация, загуба на доверие - оправдава първо превенцията.

Разгледайте ценообразуването за вашата компания. Прочетете нашата декларация на основателя защо превенцията на първо място е нашият основен принцип на проектиране.

Източници

Cyberhaven: Проучване за излагането на данни чрез ИИ 2025 - cyberhaven.com.
Пробив на данни на Samsung ChatGPT, март 2023 - Bloomberg.
GDPR членове 4 и 32: Лични данни и технически мерки - gdpr-info.eu.

Свързани статии

Сигурност на AI

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.

Започнете безплатен пробен период Вижте функции

Защита от изтичане на лични данни чрез ИИ в реално време