48言語。1つのプラットフォーム。

ネイティブパターンサポートを使用して48言語でPIIを検出および匿名化します。アラビア語、ヘブライ語、ペルシャ語、ウルドゥー語の完全なRTLサポート。

48言語に対応

プラットフォーム全体での完全なPII検出および匿名化

🌍ヨーロッパ28 言語

en
English
English
United KingdomIrelandMaltaUnited StatesCanadaAustraliaNew ZealandSouth AfricaNigeriaKenyaGhanaSingaporeJamaica
spaCy NLP
de
German
Deutsch
DeutschlandÖsterreichSchweizLuxemburgLiechtensteinBelgien
spaCy NLP
fr
French
Français
FranceBelgiqueSuisseLuxembourgMonacoSénégalCôte d'IvoireCamerounRépublique dém. du CongoMadagascarRwandaHaïtiCanada (Québec)
spaCy NLP
it
Italian
Italiano
ItaliaSan MarinoSvizzeraCittà del Vaticano
spaCy NLP
nl
Dutch
Nederlands
NederlandBelgiëSurinameArubaCuraçao
spaCy NLP
ru
Russian
Русский
РоссияБеларусьКазахстанКыргызстан
spaCy NLP
pl
Polish
Polski
Polska
spaCy NLP
uk
Ukrainian
Українська
Україна
spaCy NLP
cs
Czech
Čeština
Česká republika
Stanza NLP
sk
Slovak
Slovenčina
Slovensko
XLM-RoBERTa
hu
Hungarian
Magyar
Magyarország
Stanza NLP
bg
Bulgarian
Български
България
Stanza NLP
sr
Serbian
Српски
СрбијаБосна и Херцеговина
XLM-RoBERTa
ro
Romanian
Română
RomâniaRepublica Moldova
spaCy NLP
el
Greek
Ελληνικά
ΕλλάδαΚύπρος
spaCy NLP
hr
Croatian
Hrvatski
HrvatskaBosna i Hercegovina
spaCy NLP
sl
Slovenian
Slovenščina
Slovenija
spaCy NLP
mk
Macedonian
Македонски
Северна Македонија
spaCy NLP
sv
Swedish
Svenska
SverigeFinland
spaCy NLP
da
Danish
Dansk
Danmark
spaCy NLP
nb
Norwegian
Norsk
Norge
spaCy NLP
fi
Finnish
Suomi
Suomi
spaCy NLP
is
Icelandic
Íslenska
Ísland
XLM-RoBERTa
lt
Lithuanian
Lietuvių
Lietuva
spaCy NLP
lv
Latvian
Latviešu
Latvija
XLM-RoBERTa
et
Estonian
Eesti
Eesti
XLM-RoBERTa
ca
Catalan
Català
Espanya (Catalunya)Andorra
spaCy NLP
eu
Basque
Euskara
Espainia (Euskal Herria)Frantzia (Iparralde)
Stanza NLP

🌎アメリカ大陸2 言語

es
Spanish
Español
EspañaMéxicoColombiaArgentinaPerúChileVenezuelaEcuadorGuatemalaCubaBoliviaRepública DominicanaHondurasParaguayEl SalvadorNicaraguaCosta RicaPanamáUruguayGuinea Ecuatorial
spaCy NLP
pt
Portuguese
Português
BrasilPortugalAngolaMoçambiqueCabo VerdeGuiné-BissauSão Tomé e PríncipeTimor-Leste
spaCy NLP

🌍アフリカ2 言語

sw
Swahili
Kiswahili
TanzaniaKenyaUgandaJamhuri ya Kidemokrasia ya KongoRwandaBurundiMsumbiji
XLM-RoBERTa
af
Afrikaans
Afrikaans
Suid-AfrikaNamibië
Stanza NLP

🌏中東5 言語

arRTL
Arabic
العربية
المملكة العربية السعوديةمصرالإماراتالعراقسورياالأردنلبنانالكويتقطرالبحرينعُماناليمنليبياتونسالجزائرالمغربالسودان
XLM-RoBERTa
heRTL
Hebrew
עברית
ישראל
Stanza NLP
faRTL
Persian
فارسی
ایرانافغانستان (دری)تاجیکستان (تاجیکی)
XLM-RoBERTa
tr
Turkish
Türkçe
TürkiyeKıbrıs
XLM-RoBERTa
hy
Armenian
Հայերեն
Հայաստան
Stanza NLP

🌏南アジア3 言語

hi
Hindi
हिन्दी
भारत
XLM-RoBERTa
bn
Bengali
বাংলা
বাংলাদেশভারত (পশ্চিমবঙ্গ)
XLM-RoBERTa
urRTL
Urdu
اردو
پاکستانبھارت
XLM-RoBERTa

🌏東南アジア5 言語

id
Indonesian
Bahasa Indonesia
Indonesia
Stanza NLP
ms
Malay
Bahasa Melayu
MalaysiaBrunei DarussalamSingapura
XLM-RoBERTa
tl
Tagalog
Tagalog
Pilipinas
XLM-RoBERTa
vi
Vietnamese
Tiếng Việt
Việt Nam
Stanza NLP
th
Thai
ไทย
ประเทศไทย
XLM-RoBERTa

🌏東アジア3 言語

zh
Chinese
中文
中国台灣新加坡
spaCy NLP
ja
Japanese
日本語
日本
spaCy NLP
ko
Korean
한국어
대한민국조선민주주의인민공화국
spaCy NLP

多言語機能

自動検出

当社のシステムは、テキストの言語を自動的に識別し、適切な検出モデルを適用します。

  • 48言語をサポート
  • 手動選択は不要

RTL言語サポート

双方向テキスト処理に適切に対応した右から左への言語を完全にサポートします。

  • アラビア語、ヘブライ語、ペルシャ語、ウルドゥー語
  • 正しいテキスト配置

スマートモデル読み込み

メモリ使用量を最小限に抑え、パフォーマンスを向上させるために、必要に応じて言語モデルを読み込みます。

  • 必要なモデルのみを読み込み
  • 最大5つのモデルをキャッシュ

Industry Precision Benchmark — Feb 2026

Independent benchmarks on mixed-language datasets reveal a critical gap in multilingual PII detection across the industry.

Industry average

22.7% precision

3.4 false positives per real PII finding in mixed-language datasets

anonym.legal

285+ entity types

spaCy NLP engine across 48 languages — 419/419 test cases passing

Why precision matters in multilingual PII detection

Low precision means more false positives — legitimate data gets blocked, workflows break

Mixed-language documents (e.g., German contracts with English headers) require per-language NLP models — not a single global model

spaCy NER models trained per language outperform multilingual transformers on country-specific entity formats (PESEL, IBAN, BSN, etc.)

GDPR and regional data protection laws require correct identification — misidentification creates compliance risk

国別フォーマット

各国および地域特有のフォーマットでPIIを検出します。

欧州フォーマット

  • ドイツ: Personalausweis, Steuer-ID
  • フランス: NIR, Carte Nationale
  • イタリア: Codice Fiscale
  • スペイン: DNI, NIE
  • オランダ: BSN
  • ポーランド: PESEL

グローバルフォーマット

  • 米国: SSN, 運転免許証
  • 英国: National Insurance
  • カナダ: SIN
  • オーストラリア: TFN, Medicare
  • 日本: マイナンバー
  • インド: Aadhaar, PAN

どの言語でも匿名化

300の無料トークンから始めます。すべての48言語で動作します。

無料アカウントを作成