支持48种语言
整个平台的完整PII检测和匿名化
🌍欧洲— 28 语言
🌎美洲— 2 语言
🌍非洲— 2 语言
🌏中东— 5 语言
🌏南亚— 3 语言
🌏东南亚— 5 语言
🌏东亚— 3 语言
多语言功能
自动检测
我们的系统会自动识别您文本的语言,并应用相应的检测模型。
- 支持 48 种语言
- 无需手动选择
RTL 语言支持
对从右到左语言提供完整支持,并正确处理双向文本。
- 阿拉伯语、希伯来语、波斯语、乌尔都语
- 文本定位正确
智能模型加载
按需加载语言模型,以最大限度降低内存占用并提升性能。
- 仅加载所需模型
- 缓存最多 5 个模型
Industry Precision Benchmark — Feb 2026
Independent benchmarks on mixed-language datasets reveal a critical gap in multilingual PII detection across the industry.
Industry average
22.7% precision
3.4 false positives per real PII finding in mixed-language datasets
anonym.legal
285+ entity types
spaCy NLP engine across 48 languages — 419/419 test cases passing
Why precision matters in multilingual PII detection
Low precision means more false positives — legitimate data gets blocked, workflows break
Mixed-language documents (e.g., German contracts with English headers) require per-language NLP models — not a single global model
spaCy NER models trained per language outperform multilingual transformers on country-specific entity formats (PESEL, IBAN, BSN, etc.)
GDPR and regional data protection laws require correct identification — misidentification creates compliance risk
面向各国/地区的专用格式
我们可检测各国家和地区特定格式中的 PII。
欧洲格式
- 德国: Personalausweis, Steuer-ID
- 法国: NIR, Carte Nationale
- 意大利: Codice Fiscale
- 西班牙: DNI, NIE
- 荷兰: BSN
- 波兰: PESEL
全球格式
- 美国: SSN, 驾照
- 英国: National Insurance
- 加拿大: SIN
- 澳大利亚: TFN, Medicare
- 日本: My Number
- 印度: Aadhaar, PAN