Проблема: Обнаружение vs. Профилактика
77% сотрудников вставляют конфиденциальные данные в AI инструменты.
Текущий подход: Обнаружение после утечки
- Сотрудник вводит email в ChatGPT
- Система обнаруживает утечку в логах
- Уже слишком поздно
Правильный подход: Профилактика в реальном времени
- Сотрудник пытается вставить email в ChatGPT
- Система блокирует перед отправкой
- Данные никогда не уходят
Архитектура профилактики
1. Browser Extension
Перехватывает все попытки ввода перед отправкой:
// В контексте страницы ChatGPT
document.addEventListener('beforeSend', (e) => {
const text = e.detail.message;
const piiDetected = await analyzeForPII(text);
if (piiDetected.length > 0) {
e.preventDefault();
showWarning("Email найден в сообщении");
}
});
Покрытие: ChatGPT, Claude, Gemini, Copilot, Perplexity
2. Native App Integration
Microsoft Word Add-in
async function checkBeforeSend() {
const document = await Word.run(async (context) => {
const body = context.document.body.getRange();
const text = body.text;
const analysis = await presidio.analyze(text);
if (analysis.results.length > 0) {
showNotification("⚠️ PII обнаружена");
return false;
}
return true;
});
}
3. API-уровень профилактика
from fastapi import FastAPI
from presidio_analyzer import AnalyzerEngine
app = FastAPI()
analyzer = AnalyzerEngine()
@app.post("/api/send-to-ai")
async def prevent_pii_leak(request: SendRequest):
results = analyzer.analyze(
text=request.text,
language=request.language
)
if results:
return {
"error": "PII detected",
"entities": [
{"type": e.entity_type, "start": e.start, "end": e.end}
for e in results
],
"allowed": False
}
# Только если нет PII
return await send_to_ai_service(request)
Практические уровни защиты
Уровень 1: Предупреждение (Yellow)
⚠️ Email-адрес обнаружен. Вы уверены?
[Отправить все равно] [Редактировать]
Уровень 2: Блокировка (Red)
❌ Отправка заблокирована: содержит 3 email-адреса
Отредактируйте текст или используйте анонимные адреса.
Уровень 3: Автоматическое удаление (Green)
✅ Автоматически очищено:
- john.smith@company.com → [EMAIL]
- +1-555-0123 → [PHONE]
Безопасно отправить в ChatGPT? [ДА]
Технические вызовы
1. Асинхронность
Анализ занимает 200–500ms. UI должна быть отзывчивой.
Решение: Локальный кеш результатов анализа
2. Языковая поддержка
PII выглядит по-разному на английском, немецком и китайском.
Решение: Автоопределение языка перед анализом
3. Ложные срабатывания
"911" может быть номером скорой или просто числом.
Решение: Контекстный анализ и пороги уверенности
Рекомендации
- Комбинируйте подходы: Browser Extension + API-уровень
- Используйте 285+ типов сущностей: Не только emails и номера телефонов
- Тестируйте на вашем языке: spaCy модели часто слабы на неанглийских языках
- Обучайте сотрудников: "PII профилактика" в политике компании
Вывод
Профилактика в реальном времени — единственный способ по-настоящему защитить данные от утечки в AI инструменты.