Neden Regex, Neden AI Değil?

Düzenleyici uyumluluk için, açıklayabileceğiniz ve tekrarlayabileceğiniz sonuçlara ihtiyacınız var. Bizim deterministik yaklaşımımız tam olarak bunu sağlıyor—kara kutular yok, sürpriz yok.

Detaylı Karşılaştırma

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Yapılandırılmış Veri
Regex Desenleri
E-postalar, SSN'ler, kredi kartları, IBAN'lar, telefon numaraları
İsimler & Organizasyonlar
ML Modelleri (spaCy, Stanza)
Kişi isimleri, şirket isimleri, yerler
48 Dil
XLM-RoBERTa
Çapraz dil varlık tanıma
Tekrarlanabilirlik
%100 Tekrar Edilebilir
Aynı girdi = her seferinde aynı çıktı
İsim Tespiti
Yüksek Doğrulukta ML
Güven puanları ile kanıtlanmış NLP modelleri
Denetlenebilirlik
+Tamamen Denetlenebilir
Her varlık için konum, tür, güven puanı

Desen Eşleştirmenin Nasıl Çalıştığı

Her varlık türü, belirli formatlarla eşleşen özenle hazırlanmış regex desenlerine sahiptir.

E-posta Adresleri

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Standart e-posta formatıyla eşleşir: local-part@domain.tld

Kredi Kartı Numaraları

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Visa, Mastercard, Amex ve diğer kart formatlarıyla Luhn doğrulaması ile eşleşir

Alman IBAN

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Opsiyonel boşluklarla Alman IBAN formatıyla eşleşir

Uyumluluk İçin Tasarlandı

Denetçiler "bu neden tespit edildi?" diye sorduğunda, net bir yanıt almanız gerekir. Regex tabanlı yaklaşımımız tam olarak bunu sağlar.

  • GDPR Madde 25: Açıklanabilir işleme ile tasarımda gizlilik
  • ISO 27001: Belgelendirilmiş, tekrarlanabilir süreçler
  • Denetim İzleme: Her tespit belirli bir desene izlenebilir

Örnek Denetim Yanıtı

S: "john.smith@company.com" neden işaretlendi?
C: 45-68 pozisyonunda %0.95 güven ile e-posta desenine eşleşti. Desen: standart e-posta formatı doğrulaması.

Deterministik Tespiti Deneyimleyin

Regex tabanlı PII tespitini 200 token ile ücretsiz deneyin.