anonym.legal
Назад к блогуБезопасность ИИ

Профилактика PII в реальном времени...

Обнаружение недостаточно — вам нужна профилактика в реальном времени перед отправкой в ChatGPT, Claude, Gemini.

April 21, 20267 мин чтения
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

Проблема: Обнаружение vs. Профилактика

77% сотрудников вставляют конфиденциальные данные в AI инструменты.

Текущий подход: Обнаружение после утечки

  • Сотрудник вводит email в ChatGPT
  • Система обнаруживает утечку в логах
  • Уже слишком поздно

Правильный подход: Профилактика в реальном времени

  • Сотрудник пытается вставить email в ChatGPT
  • Система блокирует перед отправкой
  • Данные никогда не уходят

Архитектура профилактики

1. Browser Extension

Перехватывает все попытки ввода перед отправкой:

// В контексте страницы ChatGPT
document.addEventListener('beforeSend', (e) => {
    const text = e.detail.message;
    const piiDetected = await analyzeForPII(text);
    
    if (piiDetected.length > 0) {
        e.preventDefault();
        showWarning("Email найден в сообщении");
    }
});

Покрытие: ChatGPT, Claude, Gemini, Copilot, Perplexity

2. Native App Integration

Microsoft Word Add-in

async function checkBeforeSend() {
    const document = await Word.run(async (context) => {
        const body = context.document.body.getRange();
        const text = body.text;
        const analysis = await presidio.analyze(text);
        
        if (analysis.results.length > 0) {
            showNotification("⚠️ PII обнаружена");
            return false;
        }
        return true;
    });
}

3. API-уровень профилактика

from fastapi import FastAPI
from presidio_analyzer import AnalyzerEngine

app = FastAPI()
analyzer = AnalyzerEngine()

@app.post("/api/send-to-ai")
async def prevent_pii_leak(request: SendRequest):
    results = analyzer.analyze(
        text=request.text,
        language=request.language
    )
    
    if results:
        return {
            "error": "PII detected",
            "entities": [
                {"type": e.entity_type, "start": e.start, "end": e.end}
                for e in results
            ],
            "allowed": False
        }
    
    # Только если нет PII
    return await send_to_ai_service(request)

Практические уровни защиты

Уровень 1: Предупреждение (Yellow)

⚠️ Email-адрес обнаружен. Вы уверены?
[Отправить все равно] [Редактировать]

Уровень 2: Блокировка (Red)

❌ Отправка заблокирована: содержит 3 email-адреса
Отредактируйте текст или используйте анонимные адреса.

Уровень 3: Автоматическое удаление (Green)

✅ Автоматически очищено:
- john.smith@company.com → [EMAIL]
- +1-555-0123 → [PHONE]

Безопасно отправить в ChatGPT? [ДА]

Технические вызовы

1. Асинхронность

Анализ занимает 200–500ms. UI должна быть отзывчивой.

Решение: Локальный кеш результатов анализа

2. Языковая поддержка

PII выглядит по-разному на английском, немецком и китайском.

Решение: Автоопределение языка перед анализом

3. Ложные срабатывания

"911" может быть номером скорой или просто числом.

Решение: Контекстный анализ и пороги уверенности

Рекомендации

  1. Комбинируйте подходы: Browser Extension + API-уровень
  2. Используйте 285+ типов сущностей: Не только emails и номера телефонов
  3. Тестируйте на вашем языке: spaCy модели часто слабы на неанглийских языках
  4. Обучайте сотрудников: "PII профилактика" в политике компании

Вывод

Профилактика в реальном времени — единственный способ по-настоящему защитить данные от утечки в AI инструменты.

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.