لماذا Regex، وليس الذكاء الاصطناعي؟
للامتثال التنظيمي، تحتاج إلى نتائج يمكنك شرحها وإعادة إنتاجها. يوفر نهجنا الحتمي ذلك بالضبط - لا صناديق سوداء، لا مفاجآت.
مقارنة مفصلة
We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.
| Entity Type | Detection Method | Examples |
|---|---|---|
| بيانات منظمة | أنماط Regex | البريد الإلكتروني، أرقام الضمان الاجتماعي، بطاقات الائتمان، IBANs، أرقام الهواتف |
| الأسماء والمنظمات | نماذج التعلم الآلي (spaCy، Stanza) | أسماء الأشخاص، أسماء الشركات، المواقع |
| 48 لغة | XLM-RoBERTa | التعرف على الكيانات عبر اللغات |
| قابلية التكرار | قابل للتكرار بنسبة 100% | نفس المدخل = نفس المخرج، في كل مرة |
| كشف الأسماء | دقة عالية في التعلم الآلي | نماذج NLP مثبتة مع درجات الثقة |
| قابلية التدقيق | +قابل للتدقيق بالكامل | الموقع، النوع، الثقة لكل كيان |
كيف تعمل مطابقة الأنماط
كل نوع من الكيانات لديه أنماط Regex مصممة بعناية تتطابق مع تنسيقات محددة.
عناوين البريد الإلكتروني
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}تتطابق مع تنسيق البريد الإلكتروني القياسي: local-part@domain.tld
أرقام بطاقات الائتمان
\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\bتتطابق مع Visa وMastercard وAmex وغيرها من تنسيقات البطاقات مع تحقق Luhn
IBAN الألماني
DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}تتطابق مع تنسيق IBAN الألماني مع مسافات اختيارية
مصمم للامتثال
عندما يسأل المدققون "لماذا تم الكشف عن هذا؟" تحتاج إلى إجابة واضحة. يوفر نهجنا القائم على Regex ذلك بالضبط.
- المادة 25 من GDPR: الخصوصية من خلال التصميم مع معالجة قابلة للتفسير
- ISO 27001: عمليات موثقة وقابلة للتكرار
- سجل التدقيق: يمكن تتبع كل كشف إلى نمط محدد
مثال على رد المدقق
س: لماذا تم الإشارة إلى "john.smith@company.com"؟
ج: تطابق نمط البريد الإلكتروني في الموقع 45-68 مع ثقة 0.95. النمط: تحقق من تنسيق البريد الإلكتروني القياسي.
اختبر الكشف الحتمي
جرب كشف PII القائم على Regex مجانًا مع 200 رمز لكل دورة.