Чому Regex, а не ШІ?
Для регуляторної відповідності вам потрібні результати, які ви можете пояснити та відтворити. Наш детермінований підхід забезпечує саме це — жодних чорних скриньок, жодних сюрпризів.
Докладне порівняння
We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.
| Entity Type | Detection Method | Examples |
|---|---|---|
| Структуровані Дані | Шаблони Regex | Електронні адреси, SSN, кредитні картки, IBAN, номери телефонів |
| Імена та Організації | ML Моделі (spaCy, Stanza) | Імена осіб, назви компаній, місця |
| 48 Мов | XLM-RoBERTa | Крос-мовне розпізнавання сутностей |
| Відтворюваність | 100% Відтворюваність | Той самий вхід = той самий вихід, кожного разу |
| Виявлення Імен | Висока Точність ML | Перевірені NLP моделі з оцінками впевненості |
| Аудитованість | +Повністю Аудитоване | Позиція, тип, впевненість для кожної сутності |
Як працює співпадіння шаблонів
Кожен тип сутності має ретельно розроблені шаблони regex, які відповідають специфічним форматам.
Адреси електронної пошти
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}Відповідає стандартному формату електронної пошти: local-part@domain.tld
Номери кредитних карт
\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\bВідповідає форматам Visa, Mastercard, Amex та іншим карткам з валідацією Luhn
Німецький IBAN
DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}Відповідає формату німецького IBAN з необов'язковими пробілами
Створено для відповідності
Коли аудитори запитують "чому це було виявлено?" вам потрібна чітка відповідь. Наш підхід на основі regex забезпечує саме це.
- GDPR Стаття 25: Конфіденційність за замовчуванням з пояснювальною обробкою
- ISO 27001: Документовані, повторювані процеси
- Аудиторський слід: Кожне виявлення можна відстежити до конкретного шаблону
Приклад відповіді аудитора
Відчуйте детерміноване виявлення
Спробуйте наше виявлення PII на основі regex безкоштовно з 200 токенами за цикл.