anonym.legal

By · Last updated 2026-06-05

Назад к блогуБезопасность ИИ

Защита от утечки ПДн через ИИ в реальном времени

Когда сотрудник вводит имя клиента в ChatGPT, данные мгновенно покидают контур организации. Постфактумные DLP-решения не способны исправить случившееся.

June 5, 20267 мин чтения
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

Защита ПДн в реальном времени: как остановить утечки через ИИ до их возникновения

Актуально на 2026 год.

В марте 2023 года инженер Samsung вставил исходный код в ChatGPT. Код вышел за периметр компании в ту же секунду. Ни один инструмент не успел среагировать. Постфактумные средства защиты не способны остановить утечки через ИИ. Этот инцидент наглядно это доказал.

Средства обнаружения фиксируют произошедшее — уже после того, как оно случилось. Проверки журналов, endpoint DLP и аудиторские логи работают именно так. Применительно к ИИ-утечкам «после» — это слишком поздно. Данные уже достигли модели.

Масштаб проблемы

Исследование Cyberhaven 2025 года изучило, как компании используют ИИ. Результаты оказались показательными.

  • 11% всех запросов к ChatGPT содержат конфиденциальные или персональные данные.
  • Среднестатистический сотрудник обращается к ИИ-инструментам 14 раз в день.
  • Активные пользователи — от 30 до 50 раз ежедневно.
  • При 11% это означает 3–5 отправок чувствительных данных на сотрудника в день.

В компании с 500 активными пользователями это более 2000 рискованных отправок в день. Каждая может квалифицироваться как нарушение по статье 83 GDPR. Риск не только юридический — под угрозой репутация и доверие клиентов.

Чаще всего в запросах к ИИ встречаются следующие категории данных:

  • Имена клиентов и контактная информация.
  • Номера счетов и платёжные реквизиты.
  • Медицинские записи от медработников.
  • Детали дел от юристов.
  • Служебные заметки по персоналу от HR-специалистов.
  • Внутренние данные о выручке и прогнозы продаж.

Исследование не разграничивает намеренную и случайную передачу данных. С точки зрения права оба варианта создают одинаковый риск. Сотрудник, забывший убрать имя клиента, нарушает требования так же, как тот, кто сознательно игнорирует политику. Умысел не меняет результат.

Почему обнаружение не справляется

Сетевой контроль не может читать HTTPS-трафик без перехвата TLS. Перехват TLS создаёт дополнительную нагрузку и порождает проблемы с конфиденциальностью. Современные браузеры нередко его отвергают.

Endpoint DLP отслеживает буфер обмена и нажатия клавиш. Но с задержкой. К моменту, когда агент обнаружит паттерн, запрос уже может быть отправлен.

Журналы аудита вендора фиксируют, что было передано, — уже после передачи. Они полезны для реагирования на инциденты, но не предотвращают утечки.

Обучение персонала — это политика, а не технический контроль. Исследование Cyberhaven показывает: 11% запросов по-прежнему содержат конфиденциальные данные даже в компаниях с чёткими политиками. Обучение не устраняет случайные ошибки и сбои в рабочем процессе.

Блокировка ИИ-инструментов лишает сотрудников рабочих преимуществ. В ответ они переходят на личные устройства или аккаунты — и это полностью выводит рабочий процесс за рамки какого-либо контроля.

Ни один из перечисленных методов не останавливает попадание конфиденциальных данных в ИИ-системы в режиме реального времени.

Защита в точке ввода

Единственная надёжная защита — маскировка до отправки запроса. Имя клиента, заменённое на [PERSON_1] до того, как оно покинет браузер, никогда не будет обработано ИИ-моделью.

Вот как работает встроенная маскировка:

  1. Сотрудник вводит email клиента в Claude или ChatGPT.
  2. Расширение браузера обнаруживает персональные данные в реальном времени.
  3. Сущности помечаются с указанием типа: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
  4. Сотрудник просматривает отмеченные элементы.
  5. Одним нажатием все сущности заменяются токенами.
  6. Маскированный запрос отправляется.

Модель получает запрос вида: «Клиент [PERSON_1] с почтой [EMAIL_1] имеет счёт [ACCOUNT_1]

ИИ выполняет задачу, так и не увидев реальных имён или номеров. Сотрудник знает, кто этот клиент, из контекста.

Преимущества подхода очевидны:

  • Персональные данные не попадают во внешние ИИ-системы.
  • Данные клиентов не используются для обучения моделей.
  • Сотрудники сохраняют доступ к ИИ-инструментам, продуктивность не снижается.

Инструмент не препятствует намеренной передаче данных, если сотрудник обходит его. Загрузка файлов требует отдельного рабочего процесса. Идеальных средств контроля не существует. Но встроенная маскировка устраняет случайные ошибки — а именно они составляют большинство инцидентов. В результате риск существенно снижается без изменения привычного рабочего процесса.

Кейс юридической фирмы

Сотрудники юридической фирмы использовали Claude для составления примечаний к договорам. Схема работы: копировать раздел договора, вставить в Claude, запросить резюме.

До использования Chrome-расширения — первые 6 месяцев:

  • Обнаружено 3 инцидента с утечкой клиентских данных в ходе проверки.
  • Каждый инцидент: имя клиента плюс номер дела в тексте запроса.
  • Все 3 случая — непреднамеренные.

После внедрения Chrome-расширения — следующие 6 месяцев:

  • Ноль инцидентов с утечкой клиентских данных.
  • Сотрудники получали уведомления в реальном времени при вставке разделов с именами клиентов.
  • Одним кликом «Johnson Controls Дело 2024-0347» превращалось в «[PERSON_1] Дело [REFERENCE_1]».
  • Рабочий процесс не изменился.

Управляющий партнёр прокомментировал: «Наши сотрудники знали политику ещё до внедрения расширения. Расширение сделало соблюдение требований самым удобным путём».

Познакомьтесь с опытом других компаний в нашем разделе кейсов. Ознакомьтесь со средствами контроля в обзоре по безопасности.

Документация GDPR для команд по комплаенсу

Компании, использующие маскировку в браузере при работе с ИИ, должны задокументировать её как техническое средство защиты.

Реестры обработки (ROPA): укажите, что запросы к ИИ проходят через маскировку на стороне клиента перед отправкой вендорам. Перечислите типы сущностей, версию движка и журналы развёртывания в качестве доказательств.

Соглашения с обработчиками данных: если персональные данные не поступают к ИИ-вендору, требования к DPA существенно упрощаются. Персональные данные, которые вы храните, не покидают ваши системы.

Журналы аудита: логи расширения фиксируют количество сущностей на сессию, долю маскировки и объём сущностей по типам. Эти метрики используются в отчётах по комплаенсу.

Ознакомьтесь с требованиями GDPR для ИИ-инструментов в нашем руководстве по правовому соответствию и глоссарии. Часто задаваемые вопросы — в разделе FAQ.

Заключение

Инцидент с Samsung показал: утечки через ИИ происходят быстрее, чем любое постфактумное средство контроля успевает среагировать. Исследование Cyberhaven подтвердило масштаб: 11% запросов, многократно в день, от каждого сотрудника.

Маскировка в реальном времени перед отправкой устраняет первопричину. Когда персональные данные никогда не достигают ИИ, нечего обнаруживать, логировать или очищать. Сотрудники сохраняют доступ к ИИ-инструментам. Компания сохраняет статус соответствия.

Обнаружение сообщает, когда предотвращение не сработало. Применительно к утечкам через ИИ стоимость сбоя — штрафы, репутационный ущерб, потеря доверия — оправдывает ставку на предотвращение.

Изучите тарифы для вашей компании. Прочитайте обращение основателя о том, почему принцип «предотвращение прежде всего» — в основе нашего продукта.

Источники

  • Cyberhaven: AI Data Exposure Study 2025 — cyberhaven.com.
  • Samsung ChatGPT Data Breach, март 2023 — Bloomberg.
  • GDPR, статьи 4 и 32: персональные данные и технические меры — gdpr-info.eu.

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.