למה רגקס, לא AI?
לצורך ציות רגולטורי, אתה צריך תוצאות שאתה יכול להסביר ולשחזר. הגישה הדטרמיניסטית שלנו מספקת בדיוק את זה—בלי קופסאות שחורות, בלי הפתעות.
השוואה מפורטת
We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.
| Entity Type | Detection Method | Examples |
|---|---|---|
| נתונים מובנים | תבניות Regex | אימיילים, מספרי SSN, כרטיסי אשראי, IBANים, מספרי טלפון |
| שמות וארגונים | מודלים של ML (spaCy, Stanza) | שמות אנשים, שמות חברות, מיקומים |
| 48 שפות | XLM-RoBERTa | זיהוי ישויות בין שפות |
| שחזור | 100% ניתן לשחזור | אותו קלט = אותו פלט, בכל פעם |
| זיהוי שמות | דיוק גבוה ב-ML | מודלים מוכחים של NLP עם ציוני ביטחון |
| יכולת בדיקה | +ניתן לביקורת מלאה | מיקום, סוג, ביטחון עבור כל ישות |
איך עובדת התאמת תבניות
לכל סוג ישות יש תבניות רגקס שנוצרו בקפידה שמתאימות לפורמטים ספציפיים.
כתובות דוא"ל
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}מתאימות לפורמט דוא"ל סטנדרטי: local-part@domain.tld
מספרי כרטיסי אשראי
\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\bמתאימות לפורמטים של Visa, Mastercard, Amex, וכרטיסים אחרים עם אימות Luhn
IBAN גרמני
DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}מתאימות לפורמט IBAN גרמני עם רווחים אופציונליים
בנוי לציות
כאשר מבקרים שואלים "למה זה זוהה?" אתה צריך תשובה ברורה. הגישה המבוססת רגקס שלנו מספקת בדיוק את זה.
- GDPR סעיף 25: פרטיות בעיצוב עם עיבוד ניתן להסבר
- ISO 27001: תהליכים מתועדים וחוזרים על עצמם
- עקבות בדיקה: כל זיהוי ניתן למעקב לתבנית ספציפית
תשובת בדיקה לדוגמה
ש: למה "john.smith@company.com" זוהה?
ת: תואם תבנית דוא"ל במיקום 45-68 עם ביטחון 0.95. תבנית: אימות פורמט דוא"ל סטנדרטי.
חווה זיהוי דטרמיניסטי
נסה את זיהוי ה-PII המבוסס רגקס שלנו חינם עם 200 טוקנים לכל מחזור.