48言語に対応
プラットフォーム全体での完全なPII検出および匿名化
🌍ヨーロッパ— 28 言語
🌎アメリカ大陸— 2 言語
🌍アフリカ— 2 言語
🌏中東— 5 言語
🌏南アジア— 3 言語
🌏東南アジア— 5 言語
🌏東アジア— 3 言語
多言語機能
自動検出
当社のシステムは、テキストの言語を自動的に識別し、適切な検出モデルを適用します。
- 48言語をサポート
- 手動選択は不要
RTL言語サポート
双方向テキスト処理に適切に対応した右から左への言語を完全にサポートします。
- アラビア語、ヘブライ語、ペルシャ語、ウルドゥー語
- 正しいテキスト配置
スマートモデル読み込み
メモリ使用量を最小限に抑え、パフォーマンスを向上させるために、必要に応じて言語モデルを読み込みます。
- 必要なモデルのみを読み込み
- 最大5つのモデルをキャッシュ
Industry Precision Benchmark — Feb 2026
Independent benchmarks on mixed-language datasets reveal a critical gap in multilingual PII detection across the industry.
Industry average
22.7% precision
3.4 false positives per real PII finding in mixed-language datasets
anonym.legal
285+ entity types
spaCy NLP engine across 48 languages — 419/419 test cases passing
Why precision matters in multilingual PII detection
Low precision means more false positives — legitimate data gets blocked, workflows break
Mixed-language documents (e.g., German contracts with English headers) require per-language NLP models — not a single global model
spaCy NER models trained per language outperform multilingual transformers on country-specific entity formats (PESEL, IBAN, BSN, etc.)
GDPR and regional data protection laws require correct identification — misidentification creates compliance risk
国別フォーマット
各国および地域特有のフォーマットでPIIを検出します。
欧州フォーマット
- ドイツ: Personalausweis, Steuer-ID
- フランス: NIR, Carte Nationale
- イタリア: Codice Fiscale
- スペイン: DNI, NIE
- オランダ: BSN
- ポーランド: PESEL
グローバルフォーマット
- 米国: SSN, 運転免許証
- 英国: National Insurance
- カナダ: SIN
- オーストラリア: TFN, Medicare
- 日本: マイナンバー
- インド: Aadhaar, PAN