لماذا Regex، وليس الذكاء الاصطناعي؟

للامتثال التنظيمي، تحتاج إلى نتائج يمكنك شرحها وإعادة إنتاجها. يوفر نهجنا الحتمي ذلك بالضبط - لا صناديق سوداء، لا مفاجآت.

مقارنة مفصلة

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
بيانات منظمة
أنماط Regex
البريد الإلكتروني، أرقام الضمان الاجتماعي، بطاقات الائتمان، IBANs، أرقام الهواتف
الأسماء والمنظمات
نماذج التعلم الآلي (spaCy، Stanza)
أسماء الأشخاص، أسماء الشركات، المواقع
48 لغة
XLM-RoBERTa
التعرف على الكيانات عبر اللغات
قابلية التكرار
قابل للتكرار بنسبة 100%
نفس المدخل = نفس المخرج، في كل مرة
كشف الأسماء
دقة عالية في التعلم الآلي
نماذج NLP مثبتة مع درجات الثقة
قابلية التدقيق
+قابل للتدقيق بالكامل
الموقع، النوع، الثقة لكل كيان

كيف تعمل مطابقة الأنماط

كل نوع من الكيانات لديه أنماط Regex مصممة بعناية تتطابق مع تنسيقات محددة.

عناوين البريد الإلكتروني

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

تتطابق مع تنسيق البريد الإلكتروني القياسي: local-part@domain.tld

أرقام بطاقات الائتمان

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

تتطابق مع Visa وMastercard وAmex وغيرها من تنسيقات البطاقات مع تحقق Luhn

IBAN الألماني

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

تتطابق مع تنسيق IBAN الألماني مع مسافات اختيارية

مصمم للامتثال

عندما يسأل المدققون "لماذا تم الكشف عن هذا؟" تحتاج إلى إجابة واضحة. يوفر نهجنا القائم على Regex ذلك بالضبط.

  • المادة 25 من GDPR: الخصوصية من خلال التصميم مع معالجة قابلة للتفسير
  • ISO 27001: عمليات موثقة وقابلة للتكرار
  • سجل التدقيق: يمكن تتبع كل كشف إلى نمط محدد

مثال على رد المدقق

س: لماذا تم الإشارة إلى "john.smith@company.com"؟
ج: تطابق نمط البريد الإلكتروني في الموقع 45-68 مع ثقة 0.95. النمط: تحقق من تنسيق البريد الإلكتروني القياسي.

اختبر الكشف الحتمي

جرب كشف PII القائم على Regex مجانًا مع 200 رمز لكل دورة.