Zakaj Regex, ne AI?
Za regulativno skladnost potrebujete rezultate, ki jih lahko razložite in ponovite. Naš deterministični pristop prinaša ravno to—brez črnih škatel, brez presenečenj.
Podrobna primerjava
We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.
| Entity Type | Detection Method | Examples |
|---|---|---|
| Strukturirani podatki | Regex vzorci | E-pošta, SSN, kreditne kartice, IBAN, telefonske številke |
| Imena in organizacije | ML modeli (spaCy, Stanza) | Imena oseb, imena podjetij, lokacije |
| 48 jezikov | XLM-RoBERTa | Prečno jezikovno prepoznavanje entitet |
| Ponovljivost | 100% ponovljivo | Enak vhod = enak izhod, vsakič |
| Prepoznavanje imen | Visoka natančnost ML | Dokazani NLP modeli z rezultati zaupanja |
| Auditable | +Popolnoma revizibilno | Položaj, tip, zaupanje za vsako entiteto |
Kako deluje ujemanje vzorcev
Vsak tip entitete ima skrbno oblikovane regex vzorce, ki ustrezajo specifičnim formatom.
E-poštni naslovi
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}Ustreza standardnemu formatu e-pošte: lokalni-del@domena.tld
Številke kreditnih kartic
\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\bUstreza Visa, Mastercard, Amex in drugim formatom kartic s preverjanjem Luhn
Nemški IBAN
DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}Ustreza nemškemu formatu IBAN z neobveznimi presledki
Zgrajeno za skladnost
Ko revizorji vprašajo "zakaj je bilo to zaznano?" potrebujete jasen odgovor. Naš pristop na osnovi regex prinaša ravno to.
- GDPR člen 25: Zasebnost po zasnovi z razložljivo obdelavo
- ISO 27001: Dokumentirani, ponovljivi procesi
- Revizijska sled: Vsaka zaznava je mogoče slediti do specifičnega vzorca
Primer revizijskega odgovora
Izkušnje z determinističnim zaznavanjem
Preizkusite naše regex-podprto zaznavanje PII brezplačno s 200 tokeni na cikel.