۴۸ زبان. یک پلتفرم.

شناسایی و ناشناس‌سازی PII در ۴۸ زبان با پشتیبانی از الگوهای بومی. پشتیبانی کامل RTL برای عربی، عبری، فارسی و اردو.

پشتیبانی از ۴۸ زبان

شناسایی و ناشناس‌سازی کامل PII در سرتاسر پلتفرم

🌍اروپا28 زبان‌ها

en
English
English
United KingdomIrelandMaltaUnited StatesCanadaAustraliaNew ZealandSouth AfricaNigeriaKenyaGhanaSingaporeJamaica
spaCy NLP
de
German
Deutsch
DeutschlandÖsterreichSchweizLuxemburgLiechtensteinBelgien
spaCy NLP
fr
French
Français
FranceBelgiqueSuisseLuxembourgMonacoSénégalCôte d'IvoireCamerounRépublique dém. du CongoMadagascarRwandaHaïtiCanada (Québec)
spaCy NLP
it
Italian
Italiano
ItaliaSan MarinoSvizzeraCittà del Vaticano
spaCy NLP
nl
Dutch
Nederlands
NederlandBelgiëSurinameArubaCuraçao
spaCy NLP
ru
Russian
Русский
РоссияБеларусьКазахстанКыргызстан
spaCy NLP
pl
Polish
Polski
Polska
spaCy NLP
uk
Ukrainian
Українська
Україна
spaCy NLP
cs
Czech
Čeština
Česká republika
Stanza NLP
sk
Slovak
Slovenčina
Slovensko
XLM-RoBERTa
hu
Hungarian
Magyar
Magyarország
Stanza NLP
bg
Bulgarian
Български
България
Stanza NLP
sr
Serbian
Српски
СрбијаБосна и Херцеговина
XLM-RoBERTa
ro
Romanian
Română
RomâniaRepublica Moldova
spaCy NLP
el
Greek
Ελληνικά
ΕλλάδαΚύπρος
spaCy NLP
hr
Croatian
Hrvatski
HrvatskaBosna i Hercegovina
spaCy NLP
sl
Slovenian
Slovenščina
Slovenija
spaCy NLP
mk
Macedonian
Македонски
Северна Македонија
spaCy NLP
sv
Swedish
Svenska
SverigeFinland
spaCy NLP
da
Danish
Dansk
Danmark
spaCy NLP
nb
Norwegian
Norsk
Norge
spaCy NLP
fi
Finnish
Suomi
Suomi
spaCy NLP
is
Icelandic
Íslenska
Ísland
XLM-RoBERTa
lt
Lithuanian
Lietuvių
Lietuva
spaCy NLP
lv
Latvian
Latviešu
Latvija
XLM-RoBERTa
et
Estonian
Eesti
Eesti
XLM-RoBERTa
ca
Catalan
Català
Espanya (Catalunya)Andorra
spaCy NLP
eu
Basque
Euskara
Espainia (Euskal Herria)Frantzia (Iparralde)
Stanza NLP

🌎آمریکاها2 زبان‌ها

es
Spanish
Español
EspañaMéxicoColombiaArgentinaPerúChileVenezuelaEcuadorGuatemalaCubaBoliviaRepública DominicanaHondurasParaguayEl SalvadorNicaraguaCosta RicaPanamáUruguayGuinea Ecuatorial
spaCy NLP
pt
Portuguese
Português
BrasilPortugalAngolaMoçambiqueCabo VerdeGuiné-BissauSão Tomé e PríncipeTimor-Leste
spaCy NLP

🌍آفریقا2 زبان‌ها

sw
Swahili
Kiswahili
TanzaniaKenyaUgandaJamhuri ya Kidemokrasia ya KongoRwandaBurundiMsumbiji
XLM-RoBERTa
af
Afrikaans
Afrikaans
Suid-AfrikaNamibië
Stanza NLP

🌏خاورمیانه5 زبان‌ها

arRTL
Arabic
العربية
المملكة العربية السعوديةمصرالإماراتالعراقسورياالأردنلبنانالكويتقطرالبحرينعُماناليمنليبياتونسالجزائرالمغربالسودان
XLM-RoBERTa
heRTL
Hebrew
עברית
ישראל
Stanza NLP
faRTL
Persian
فارسی
ایرانافغانستان (دری)تاجیکستان (تاجیکی)
XLM-RoBERTa
tr
Turkish
Türkçe
TürkiyeKıbrıs
XLM-RoBERTa
hy
Armenian
Հայերեն
Հայաստան
Stanza NLP

🌏جنوب آسیا3 زبان‌ها

hi
Hindi
हिन्दी
भारत
XLM-RoBERTa
bn
Bengali
বাংলা
বাংলাদেশভারত (পশ্চিমবঙ্গ)
XLM-RoBERTa
urRTL
Urdu
اردو
پاکستانبھارت
XLM-RoBERTa

🌏جنوب شرقی آسیا5 زبان‌ها

id
Indonesian
Bahasa Indonesia
Indonesia
Stanza NLP
ms
Malay
Bahasa Melayu
MalaysiaBrunei DarussalamSingapura
XLM-RoBERTa
tl
Tagalog
Tagalog
Pilipinas
XLM-RoBERTa
vi
Vietnamese
Tiếng Việt
Việt Nam
Stanza NLP
th
Thai
ไทย
ประเทศไทย
XLM-RoBERTa

🌏شرق آسیا3 زبان‌ها

zh
Chinese
中文
中国台灣新加坡
spaCy NLP
ja
Japanese
日本語
日本
spaCy NLP
ko
Korean
한국어
대한민국조선민주주의인민공화국
spaCy NLP

ویژگی‌های چند زبانه

تشخیص خودکار

سیستم ما به‌طور خودکار زبان متن شما را شناسایی کرده و مدل‌های تشخیص مناسب را اعمال می‌کند.

  • پشتیبانی از ۴۸ زبان
  • نیاز به انتخاب دستی نیست

پشتیبانی از زبان‌های راست به چپ

پشتیبانی کامل از زبان‌های راست به چپ با مدیریت صحیح متن دوطرفه.

  • عربی، عبری، فارسی، اردو
  • موقعیت‌یابی صحیح متن

بارگذاری هوشمند مدل

مدل‌های زبانی به‌صورت درخواستی بارگذاری می‌شوند تا مصرف حافظه را کاهش دهند و عملکرد را بهبود بخشند.

  • فقط مدل‌های مورد نیاز بارگذاری می‌شوند
  • تا ۵ مدل کش می‌شود

Industry Precision Benchmark — Feb 2026

Independent benchmarks on mixed-language datasets reveal a critical gap in multilingual PII detection across the industry.

Industry average

22.7% precision

3.4 false positives per real PII finding in mixed-language datasets

anonym.legal

285+ entity types

spaCy NLP engine across 48 languages — 419/419 test cases passing

Why precision matters in multilingual PII detection

Low precision means more false positives — legitimate data gets blocked, workflows break

Mixed-language documents (e.g., German contracts with English headers) require per-language NLP models — not a single global model

spaCy NER models trained per language outperform multilingual transformers on country-specific entity formats (PESEL, IBAN, BSN, etc.)

GDPR and regional data protection laws require correct identification — misidentification creates compliance risk

فرمت‌های خاص کشور

ما PII را در فرمت‌های خاص هر کشور و منطقه شناسایی می‌کنیم.

فرمت‌های اروپایی

  • آلمانی: Personalausweis, Steuer-ID
  • فرانسوی: NIR, Carte Nationale
  • ایتالیایی: Codice Fiscale
  • اسپانیایی: DNI, NIE
  • هلندی: BSN
  • لهستانی: PESEL

فرمت‌های جهانی

  • آمریکا: SSN, گواهینامه رانندگی
  • انگلستان: National Insurance
  • کانادا: SIN
  • استرالیا: TFN, Medicare
  • ژاپن: My Number
  • هند: Aadhaar, PAN

ناشناس‌سازی در هر زبانی

با ۳۰۰ توکن رایگان شروع کنید. با تمام ۴۸ زبان کار می‌کند.

ایجاد حساب کاربری رایگان