anonym.legal

Защо Регулярни Изрази, А Не ИИ?

За регулаторно съответствие, ви трябват резултати, които можете да обясните и възпроизведете. Нашият детерминистичен подход предоставя точно това—без черни кутии, без изненади.

Подробно Сравнение

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Структурирани данни
Regex шаблони
Имейли, ЕГН, кредитни карти, IBAN, телефонни номера
Имена и организации
ML модели (spaCy, Stanza)
Имена на лица, имена на компании, местоположения
48 езика
XLM-RoBERTa
Крос-лингвистично разпознаване на обекти
Възпроизводимост
100% възпроизводимо
Същият вход = същият изход, всеки път
Разпознаване на имена
Висока точност на ML
Доказани NLP модели с оценки на увереност
Одитируемост
+Напълно одитируемо
Позиция, тип, увереност за всеки обект

Как Работи Съвпадението на Модели

Всеки тип единица има внимателно изработени регулярни изрази, които съвпадат с конкретни формати.

Имейл Адреси

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Съвпада с стандартния имейл формат: local-part@domain.tld

Номера на Кредитни Карти

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Съвпада с Visa, Mastercard, Amex и други формати на карти с валидация по Лун

Немски IBAN

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Съвпада с немския IBAN формат с опционални интервали

Създадено за Съответствие

Когато одиторите питат "защо беше открито това?" ви трябва ясен отговор. Нашият подход на основата на регулярни изрази предоставя точно това.

  • GDPR Член 25: Поверителност по дизайн с обяснима обработка
  • ISO 27001: Документирани, повторяеми процеси
  • Одитен Следа: Всяко откритие може да бъде проследено до конкретен модел

Пример за Одитен Отговор

В: Защо "john.smith@company.com" беше маркиран?
О: Съвпадна с имейл модела на позиция 45-68 с увереност 0.95. Модел: валидация на стандартен имейл формат.

Изпитайте Детерминистично Откритие

Изпробвайте нашето откритие на PII на основата на регулярни изрази безплатно с 200 токена на цикъл.