Как Работи anonym.legal
Детерминистично, откритие на PII на основата на регулярни изрази, което предоставя 100% възпроизводими резултати. Същият вход, същият изход—всеки път. Без ИИ, без предположения, само прозрачно съвпадение на модели.
How Does PII Detection Work?
PII detection identifies personal data in text using pattern matching and machine learning. anonym.legal uses a hybrid approach:
- 1Pattern Matching: Regex patterns detect structured data (SSNs, credit cards, IBANs) with checksum validation.
- 2Named Entity Recognition: NER models identify names, locations, and organizations in 48 languages.
- 3Context Scoring: Each detection is scored based on surrounding context to minimize false positives.
This hybrid approach detects 285+ entity types while maintaining deterministic, reproducible results — essential for compliance and legal discovery.
Защо Регулярни Изрази, А Не ИИ?
Нашият Подход
- 100% възпроизводими резултати
- Напълно одитируеми за съответствие
- Не се изискват данни за обучение
- Прозрачно вземане на решения
- Бърза, предсказуема производителност
- Без отклонение на модела с времето
Подходи с ИИ/МЛ
- Резултатите варират между изпълненията
- Черна кутия при вземане на решения
- Изисква данни за обучение
- Трудно за одит
- По-високи разходи за изчисления
- Отклонение на модела с времето
Процес от 10 Стъпки
От вход до изход, ето какво точно се случва с вашия документ
Входен Текст
Изпратете вашия документ чрез уеб интерфейс, API или Office добавка
Откритие на Език
Системата идентифицира езика на документа за оптимална обработка
Токенизация
Текстът се разделя на токени за съвпадение на модели
Съвпадение на Модели
Регулярните изрази сканират за 285+ типа единици
Анализ на Контекста
Околният текст подобрява точността на откритие
Оценка на Увереността
Всяко откритие получава оценка на увереността
Класификация на Единиците
Откритите елементи се категоризират по тип
Преглед на Резултатите
Вижте всички открития с позиции и оценки
Прилагане на Анонимизация
Изберете вашия метод: Замяна, Затъмняване, Хеширане, Шифроване или Маскиране
Изходен Документ
Изтеглете вашия анонимен документ
MCP Сървър: Интеграция на ИИ с Поверителност на Първо Място
Как вашите данни преминават през MCP Сървъра, за да запазят инструментите на ИИ в безопасност
Заявка от Инструмент за ИИ
Вашият инструмент за ИИ (Cursor, Claude) изпраща заявка, съдържаща PII
MCP Сървърът Прихваща
Сървърът анализира и открива всички PII единици
Анонимизация
PII се заменя с токени или се затъмнява
Обработка от ИИ
ИИ получава и обработва само анонимизирани данни
Връщане на Отговор
Отговорът на ИИ се връща през MCP Сървъра
Де-токенизация
Опционално: Оригиналните стойности се възстановяват за потребителя
Пример от Реалния Свят
Обработете плащане за John Doe, имейл john@example.com, карта 4532-1111-2222-3333Какво вижда ИИ
Обработете плащане за PII_PERSON_001, имейл PII_EMAIL_001, карта PII_CREDIT_CARD_001Какво получавате обратно
Frequently Asked Questions
Why use regex instead of AI for PII detection?
Regex-based detection is deterministic and reproducible. The same input always produces the same output. AI/ML models can be unpredictable and may miss or falsely flag data. For compliance, reproducibility matters.
How accurate is the detection?
Our hybrid approach combines regex patterns with Named Entity Recognition (NER) for high accuracy. All patterns include checksum validation where applicable (credit cards, IBANs, SSNs). False positives are minimized through context-aware scoring.
What happens to my data during processing?
Text is sent to our EU-hosted servers (Hetzner, Germany) over TLS 1.3 for analysis. We don't store your data after processing. With Zero-Knowledge auth, we can't even identify which user made the request.
Can I add custom entity types?
Yes! You can create custom recognizers with your own regex patterns and context words. Custom entities support the same operators (replace, mask, hash, encrypt, redact) as built-in types.
How does reversible encryption work?
The Encrypt operator uses AES-256-GCM encryption with your key. Only you can decrypt. This allows re-identification for audits or legal discovery while keeping data protected in transit and storage.
Вижте го в Действие
Изпробвайте нашето откритие на PII и анонимизация безплатно с 200 токена на цикъл.