Почему регулярные выражения, а не ИИ?
Для соблюдения норм вам нужны результаты, которые вы можете объяснить и воспроизвести. Наш детерминированный подход предоставляет именно это — никаких черных ящиков, никаких сюрпризов.
Подробное сравнение
We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.
| Entity Type | Detection Method | Examples |
|---|---|---|
| Структурированные данные | Регулярные выражения | Электронные почты, номера социального страхования, кредитные карты, IBAN, номера телефонов |
| Имена и организации | Модели ML (spaCy, Stanza) | Имена людей, названия компаний, местоположения |
| 48 языков | XLM-RoBERTa | Кросс-языковое распознавание сущностей |
| Воспроизводимость | 100% воспроизводимо | Один и тот же ввод = один и тот же вывод, каждый раз |
| Обнаружение имен | Высокая точность ML | Проверенные модели NLP с оценками уверенности |
| Аудит | +Полностью подлежит аудиту | Позиция, тип, уверенность для каждой сущности |
Как работает сопоставление шаблонов
Каждый тип сущности имеет тщательно разработанные шаблоны регулярных выражений, которые соответствуют конкретным форматам.
Адреса электронной почты
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}Соответствует стандартному формату электронной почты: local-part@domain.tld
Номера кредитных карт
\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\bСоответствует форматам Visa, Mastercard, Amex и другим с проверкой Луна
Немецкий IBAN
DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}Соответствует формату немецкого IBAN с необязательными пробелами
Создано для соблюдения норм
Когда аудиторы спрашивают "почему это было обнаружено?", вам нужен четкий ответ. Наш подход на основе регулярных выражений предоставляет именно это.
- GDPR Статья 25: Конфиденциальность по дизайну с объяснимой обработкой
- ISO 27001: Документированные, повторяемые процессы
- Аудиторский след: Каждое обнаружение может быть прослежено к конкретному шаблону
Пример ответа на аудит
Испытайте детерминированное обнаружение
Попробуйте наше обнаружение PII на основе регулярных выражений бесплатно с 200 токенами за цикл.