Защита ПДн в реальном времени: как остановить утечки через ИИ до их возникновения
Актуально на 2026 год.
В марте 2023 года инженер Samsung вставил исходный код в ChatGPT. Код вышел за периметр компании в ту же секунду. Ни один инструмент не успел среагировать. Постфактумные средства защиты не способны остановить утечки через ИИ. Этот инцидент наглядно это доказал.
Средства обнаружения фиксируют произошедшее — уже после того, как оно случилось. Проверки журналов, endpoint DLP и аудиторские логи работают именно так. Применительно к ИИ-утечкам «после» — это слишком поздно. Данные уже достигли модели.
Масштаб проблемы
Исследование Cyberhaven 2025 года изучило, как компании используют ИИ. Результаты оказались показательными.
- 11% всех запросов к ChatGPT содержат конфиденциальные или персональные данные.
- Среднестатистический сотрудник обращается к ИИ-инструментам 14 раз в день.
- Активные пользователи — от 30 до 50 раз ежедневно.
- При 11% это означает 3–5 отправок чувствительных данных на сотрудника в день.
В компании с 500 активными пользователями это более 2000 рискованных отправок в день. Каждая может квалифицироваться как нарушение по статье 83 GDPR. Риск не только юридический — под угрозой репутация и доверие клиентов.
Чаще всего в запросах к ИИ встречаются следующие категории данных:
- Имена клиентов и контактная информация.
- Номера счетов и платёжные реквизиты.
- Медицинские записи от медработников.
- Детали дел от юристов.
- Служебные заметки по персоналу от HR-специалистов.
- Внутренние данные о выручке и прогнозы продаж.
Исследование не разграничивает намеренную и случайную передачу данных. С точки зрения права оба варианта создают одинаковый риск. Сотрудник, забывший убрать имя клиента, нарушает требования так же, как тот, кто сознательно игнорирует политику. Умысел не меняет результат.
Почему обнаружение не справляется
Сетевой контроль не может читать HTTPS-трафик без перехвата TLS. Перехват TLS создаёт дополнительную нагрузку и порождает проблемы с конфиденциальностью. Современные браузеры нередко его отвергают.
Endpoint DLP отслеживает буфер обмена и нажатия клавиш. Но с задержкой. К моменту, когда агент обнаружит паттерн, запрос уже может быть отправлен.
Журналы аудита вендора фиксируют, что было передано, — уже после передачи. Они полезны для реагирования на инциденты, но не предотвращают утечки.
Обучение персонала — это политика, а не технический контроль. Исследование Cyberhaven показывает: 11% запросов по-прежнему содержат конфиденциальные данные даже в компаниях с чёткими политиками. Обучение не устраняет случайные ошибки и сбои в рабочем процессе.
Блокировка ИИ-инструментов лишает сотрудников рабочих преимуществ. В ответ они переходят на личные устройства или аккаунты — и это полностью выводит рабочий процесс за рамки какого-либо контроля.
Ни один из перечисленных методов не останавливает попадание конфиденциальных данных в ИИ-системы в режиме реального времени.
Защита в точке ввода
Единственная надёжная защита — маскировка до отправки запроса. Имя клиента, заменённое на [PERSON_1] до того, как оно покинет браузер, никогда не будет обработано ИИ-моделью.
Вот как работает встроенная маскировка:
- Сотрудник вводит email клиента в Claude или ChatGPT.
- Расширение браузера обнаруживает персональные данные в реальном времени.
- Сущности помечаются с указанием типа: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
- Сотрудник просматривает отмеченные элементы.
- Одним нажатием все сущности заменяются токенами.
- Маскированный запрос отправляется.
Модель получает запрос вида: «Клиент [PERSON_1] с почтой [EMAIL_1] имеет счёт [ACCOUNT_1].»
ИИ выполняет задачу, так и не увидев реальных имён или номеров. Сотрудник знает, кто этот клиент, из контекста.
Преимущества подхода очевидны:
- Персональные данные не попадают во внешние ИИ-системы.
- Данные клиентов не используются для обучения моделей.
- Сотрудники сохраняют доступ к ИИ-инструментам, продуктивность не снижается.
Инструмент не препятствует намеренной передаче данных, если сотрудник обходит его. Загрузка файлов требует отдельного рабочего процесса. Идеальных средств контроля не существует. Но встроенная маскировка устраняет случайные ошибки — а именно они составляют большинство инцидентов. В результате риск существенно снижается без изменения привычного рабочего процесса.
Кейс юридической фирмы
Сотрудники юридической фирмы использовали Claude для составления примечаний к договорам. Схема работы: копировать раздел договора, вставить в Claude, запросить резюме.
До использования Chrome-расширения — первые 6 месяцев:
- Обнаружено 3 инцидента с утечкой клиентских данных в ходе проверки.
- Каждый инцидент: имя клиента плюс номер дела в тексте запроса.
- Все 3 случая — непреднамеренные.
После внедрения Chrome-расширения — следующие 6 месяцев:
- Ноль инцидентов с утечкой клиентских данных.
- Сотрудники получали уведомления в реальном времени при вставке разделов с именами клиентов.
- Одним кликом «Johnson Controls Дело 2024-0347» превращалось в «[PERSON_1] Дело [REFERENCE_1]».
- Рабочий процесс не изменился.
Управляющий партнёр прокомментировал: «Наши сотрудники знали политику ещё до внедрения расширения. Расширение сделало соблюдение требований самым удобным путём».
Познакомьтесь с опытом других компаний в нашем разделе кейсов. Ознакомьтесь со средствами контроля в обзоре по безопасности.
Документация GDPR для команд по комплаенсу
Компании, использующие маскировку в браузере при работе с ИИ, должны задокументировать её как техническое средство защиты.
Реестры обработки (ROPA): укажите, что запросы к ИИ проходят через маскировку на стороне клиента перед отправкой вендорам. Перечислите типы сущностей, версию движка и журналы развёртывания в качестве доказательств.
Соглашения с обработчиками данных: если персональные данные не поступают к ИИ-вендору, требования к DPA существенно упрощаются. Персональные данные, которые вы храните, не покидают ваши системы.
Журналы аудита: логи расширения фиксируют количество сущностей на сессию, долю маскировки и объём сущностей по типам. Эти метрики используются в отчётах по комплаенсу.
Ознакомьтесь с требованиями GDPR для ИИ-инструментов в нашем руководстве по правовому соответствию и глоссарии. Часто задаваемые вопросы — в разделе FAQ.
Заключение
Инцидент с Samsung показал: утечки через ИИ происходят быстрее, чем любое постфактумное средство контроля успевает среагировать. Исследование Cyberhaven подтвердило масштаб: 11% запросов, многократно в день, от каждого сотрудника.
Маскировка в реальном времени перед отправкой устраняет первопричину. Когда персональные данные никогда не достигают ИИ, нечего обнаруживать, логировать или очищать. Сотрудники сохраняют доступ к ИИ-инструментам. Компания сохраняет статус соответствия.
Обнаружение сообщает, когда предотвращение не сработало. Применительно к утечкам через ИИ стоимость сбоя — штрафы, репутационный ущерб, потеря доверия — оправдывает ставку на предотвращение.
Изучите тарифы для вашей компании. Прочитайте обращение основателя о том, почему принцип «предотвращение прежде всего» — в основе нашего продукта.
Источники
- Cyberhaven: AI Data Exposure Study 2025 — cyberhaven.com.
- Samsung ChatGPT Data Breach, март 2023 — Bloomberg.
- GDPR, статьи 4 и 32: персональные данные и технические меры — gdpr-info.eu.