anonym.legal

Зошто Regex, а не AI?

За регулаторна усогласеност, ви се потребни резултати кои можете да ги објасните и репродуцирате. Нашиот детерминистички пристап дава токму тоа—без црни кутији, без изненадувања.

Детален Пораст

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Структурирани Податоци
Regex Патерни
Е-пошта, SSN, кредитни картички, IBAN, телефонски броеви
Имена & Организации
ML Модели (spaCy, Stanza)
Имена на лица, имиња на компании, локации
48 Јазици
XLM-RoBERTa
Препознавање на ентитети преку јазици
Репродуктивност
100% Репродуктивно
Исти влез = ист излез, секој пат
Детекција на Имена
Висока Точност ML
Доказани NLP модели со оценки на доверба
Проверливост
+Целосно Аудитабилно
Позиција, тип, доверба за секој ентитет

Како функционира Совпаѓањето на Образци

Секој тип ентитет има внимателно изработени regex образци кои совпаѓаат со специфични формати.

Email Адреси

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Совпаѓа со стандардниот формат на е-пошта: локален-дел@домен.tld

Броеви на Кредитни Карти

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Совпаѓа со Visa, Mastercard, Amex и други формати на картички со валидација на Luhn

Германски IBAN

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Совпаѓа со германскиот IBAN формат со опционални размакнувања

Изградена за Усогласеност

Кога ревизорите прашуваат "зошто беше откриено ова?" ви е потребен јасен одговор. Нашиот regex-базиран пристап обезбедува токму тоа.

  • GDPR Член 25: Приватност по дизајн со објаснувајќи обработка
  • ISO 27001: Документирани, повторливи процеси
  • Трага за Ревизија: Секоја детекција може да се проследи до специфичен образец

Пример за Одговор на Ревизија

П: Зошто беше означен "john.smith@company.com"?
О: Совпаѓа со образецот на е-пошта на позиција 45-68 со доверба 0.95. Образец: валидација на стандардниот формат на е-пошта.

Искусете Детерминистичка Детекција

Пробајте ја нашата regex-базирана PII детекција бесплатно со 200 токени по циклус.