48 שפות נתמכות
זיהוי ואנונימיזציה מלאה של PII בכל הפלטפורמה
🌍אירופה— 28 שפות
🌎אמריקות— 2 שפות
🌍אפריקה— 2 שפות
🌏המזרח התיכון— 5 שפות
🌏דרום אסיה— 3 שפות
🌏דרום מזרח אסיה— 5 שפות
🌏מזרח אסיה— 3 שפות
תכונות בשפות מרובות
זיהוי אוטומטי
המערכת שלנו מזהה באופן אוטומטי את שפת הטקסט שלכם ומפעילה את דגמי הזיהוי המתאימים.
- תומך ב-48 שפות
- אין צורך בבחירה ידנית
תמיכה בשפות מימין לשמאל
תמיכה מלאה בשפות מימין לשמאל עם טיפול נכון בטקסט דו-כיווני.
- ערבית, עברית, פרסית, אורדו
- מיקום נכון של הטקסט
טעינת מודלים חכמה
מודלי שפה נטענים לפי דרישה כדי למזער שימוש בזיכרון ולשפר ביצועים.
- טוען רק את המודלים הנדרשים
- שומר במטמון עד 5 מודלים
Industry Precision Benchmark — Feb 2026
Independent benchmarks on mixed-language datasets reveal a critical gap in multilingual PII detection across the industry.
Industry average
22.7% precision
3.4 false positives per real PII finding in mixed-language datasets
anonym.legal
285+ entity types
spaCy NLP engine across 48 languages — 419/419 test cases passing
Why precision matters in multilingual PII detection
Low precision means more false positives — legitimate data gets blocked, workflows break
Mixed-language documents (e.g., German contracts with English headers) require per-language NLP models — not a single global model
spaCy NER models trained per language outperform multilingual transformers on country-specific entity formats (PESEL, IBAN, BSN, etc.)
GDPR and regional data protection laws require correct identification — misidentification creates compliance risk
פורמטים לפי מדינה
אנו מזהים PII בפורמטים ספציפיים לכל מדינה ואזור.
פורמטים אירופיים
- גרמניה: Personalausweis, Steuer-ID
- צרפת: NIR, Carte Nationale
- איטליה: Codice Fiscale
- ספרד: DNI, NIE
- הולנד: BSN
- פולין: PESEL
פורמטים גלובליים
- ארצות הברית: SSN, Driver's License
- בריטניה: National Insurance
- קנדה: SIN
- אוסטרליה: TFN, Medicare
- יפן: My Number
- הודו: Aadhaar, PAN