Zergatik Regex, Ez AI?

Araudi betetzeko, azaldu eta erreproduzitu daitezkeen emaitzak behar dituzu. Gure hurbilketa deterministikoak zehazki hori ematen du—ez kutxa beltzik, ez sorpresa.

Konparaketa Detallatua

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Datu Estrukturatua
Regex Patroiak
Posta elektronikoak, SSN-ak, kreditu txartelak, IBAN-ak, telefono zenbakiak
Izena & Erakundeak
ML Modeloak (spaCy, Stanza)
Pertsona izenak, enpresa izenak, kokapenak
48 Hizkuntza
XLM-RoBERTa
Hizkuntza anitzeko entitateen ezagutza
Erreproduzibiltasuna
100% Errepikagarria
Sarrera bera = irteera bera, beti
Izena Detektatzea
Zehaztasun Handiko ML
Konfiantza puntuazioak dituzten NLP modelo frogatuak
Auditatzea
+Osorik Auditatua
Posizioa, mota, konfiantza entitate bakoitzeko

Nola Funtzionatzen Duten Patroiak Matchatzea

Entitate mota bakoitzak formatu zehatzak matchatzen dituzten regex patroiak ditu.

Email Helbideak

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Estandarreko email formatuarekin bat etortzen da: local-part@domain.tld

Kredituko Txartel Zenbakiak

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Visa, Mastercard, Amex, eta beste txartel formatu batzuk Luhn balidazioarekin bat etortzen da

Alemaniako IBAN

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Alemaniako IBAN formatuarekin bat etortzen da espazio optionalekin

Araudi Betetzeko Eraikia

Auditoriek "zergatik detektatu da hau?" galdetzen dutenean, erantzun argi bat behar duzu. Gure regex oinarritutako hurbilketa zehazki hori ematen du.

  • GDPR 25. artikulua: Diseinuan pribatutasuna azalduz prozesatzea
  • ISO 27001: Dokumentatutako, errepikakorrak diren prozesuak
  • Audit Trail: Detekzio bakoitza patroi zehatz batera jarrai daiteke

Adibide Audit Erantzuna

Q: Zergatik izan da "john.smith@company.com" seinalatuta?
A: Email patroi batekin bat etorri da 45-68 posizioan konfiantza 0.95arekin. Patroi: estandarreko email formatuaren balidazioa.

Esperimentatu Detekzio Deterministikoa

Probatu gure regex oinarritutako PII detekzioa doan 200 token ziklo bakoitzeko.