anonym.legal

Zašto Regex, a ne AI?

Za regulatornu usklađenost, potrebni su vam rezultati koje možete objasniti i reprodukovati. Naš deterministički pristup pruža upravo to—bez crnih kutija, bez iznenađenja.

Detaljna uporedba

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Strukturirani Podaci
Regex Obrasci
Emailovi, SSN-ovi, kreditne kartice, IBAN-ovi, brojevi telefona
Imena i Organizacije
ML Modeli (spaCy, Stanza)
Imena osoba, imena kompanija, lokacije
48 Jezika
XLM-RoBERTa
Prepoznavanje entiteta na više jezika
Reproduktivnost
100% Reproducibilno
Isti ulaz = isti izlaz, svaki put
Detekcija Imena
Visoka Tačnost ML
Dokazani NLP modeli sa skorovima poverenja
Auditabilnost
+Potpuno Revizibilno
Pozicija, tip, poverenje za svaki entitet

Kako funkcioniše prepoznavanje obrazaca

Svaki tip entiteta ima pažljivo izrađene regex obrasce koji se podudaraju sa specifičnim formatima.

Email adrese

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Podudara se sa standardnim email formatom: lokalni-deo@domen.tld

Brojevi kreditnih kartica

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Podudara se sa Visa, Mastercard, Amex i drugim formatima kartica uz Luhn validaciju

Nemački IBAN

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Podudara se sa nemačkim IBAN formatom uz opcione razmake

Izgrađeno za usklađenost

Kada revizori pitaju "zašto je ovo detektovano?" potrebna vam je jasna odgovor. Naš regex-zasnovani pristup pruža upravo to.

  • GDPR član 25: Privatnost po dizajnu sa objašnjivom obradom
  • ISO 27001: Dokumentovani, ponovljivi procesi
  • Audit Trail: Svaka detekcija može se pratiti do specifičnog obrasca

Primer odgovora na reviziju

P: Zašto je "john.smith@company.com" označen?
O: Podudara se sa email obrascem na poziciji 45-68 sa poverenjem 0.95. Obrazac: validacija standardnog email formata.

Iskusite determinističku detekciju

Isprobajte našu regex-zasnovanu PII detekciju besplatno sa 200 tokena po ciklusu.