Dlaczego wyrażenia regularne, a nie AI?

Dla zgodności regulacyjnej potrzebujesz wyników, które możesz wyjaśnić i powtórzyć. Nasze deterministyczne podejście dostarcza dokładnie tego - bez czarnych skrzynek, bez niespodzianek.

Szczegółowe porównanie

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Dane Strukturalne
Wzorce Regex
E-maile, numery SSN, karty kredytowe, numery IBAN, numery telefonów
Nazwy i Organizacje
Modele ML (spaCy, Stanza)
Nazwy osób, nazwy firm, lokalizacje
48 Języków
XLM-RoBERTa
Rozpoznawanie encji w różnych językach
Powtarzalność
100% Powtarzalne
Ten sam input = ten sam output, za każdym razem
Wykrywanie Nazw
Wysoka Dokładność ML
Sprawdzone modele NLP z wynikami pewności
Audytowalność
+W pełni audytowalne
Pozycja, typ, pewność dla każdej encji

Jak działa dopasowywanie wzorców

Każdy typ encji ma starannie opracowane wzorce regex, które pasują do określonych formatów.

Adresy e-mail

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Pasuje do standardowego formatu e-mail: lokalna-część@domena.tld

Numery kart kredytowych

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Pasuje do formatów Visa, Mastercard, Amex i innych kart z walidacją Luhn

Niemiecki IBAN

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Pasuje do niemieckiego formatu IBAN z opcjonalnymi spacjami

Stworzony dla zgodności

Gdy audytorzy pytają "dlaczego to wykryto?" potrzebujesz jasnej odpowiedzi. Nasze podejście oparte na wyrażeniach regularnych dostarcza dokładnie tego.

  • Artykuł 25 GDPR: Prywatność w projektowaniu z wyjaśnialnym przetwarzaniem
  • ISO 27001: Udokumentowane, powtarzalne procesy
  • Ślad audytu: Każde wykrycie można przypisać do konkretnego wzorca

Przykład odpowiedzi audytowej

P: Dlaczego "john.smith@company.com" został oznaczony?
O: Dopasowano wzór e-mail na pozycji 45-68 z pewnością 0.95. Wzór: walidacja standardowego formatu e-mail.

Doświadcz deterministycznego wykrywania

Wypróbuj nasze wykrywanie PII oparte na wyrażeniach regularnych za darmo z 200 tokenami na cykl.