48 Wika. Isang Plataporma.

Tuklasin at i-anonymize ang PII sa 48 wika na may suporta sa katutubong pattern. Buong suporta sa RTL para sa Arabe, Hebreo, Persiano, at Urdu.

48 Wika ang Suportado

Buong pagtuklas at pag-anonymize ng PII sa buong plataporma

🌍Europa28 mga wika

en
English
English
United KingdomIrelandMaltaUnited StatesCanadaAustraliaNew ZealandSouth AfricaNigeriaKenyaGhanaSingaporeJamaica
spaCy NLP
de
German
Deutsch
DeutschlandÖsterreichSchweizLuxemburgLiechtensteinBelgien
spaCy NLP
fr
French
Français
FranceBelgiqueSuisseLuxembourgMonacoSénégalCôte d'IvoireCamerounRépublique dém. du CongoMadagascarRwandaHaïtiCanada (Québec)
spaCy NLP
it
Italian
Italiano
ItaliaSan MarinoSvizzeraCittà del Vaticano
spaCy NLP
nl
Dutch
Nederlands
NederlandBelgiëSurinameArubaCuraçao
spaCy NLP
ru
Russian
Русский
РоссияБеларусьКазахстанКыргызстан
spaCy NLP
pl
Polish
Polski
Polska
spaCy NLP
uk
Ukrainian
Українська
Україна
spaCy NLP
cs
Czech
Čeština
Česká republika
Stanza NLP
sk
Slovak
Slovenčina
Slovensko
XLM-RoBERTa
hu
Hungarian
Magyar
Magyarország
Stanza NLP
bg
Bulgarian
Български
България
Stanza NLP
sr
Serbian
Српски
СрбијаБосна и Херцеговина
XLM-RoBERTa
ro
Romanian
Română
RomâniaRepublica Moldova
spaCy NLP
el
Greek
Ελληνικά
ΕλλάδαΚύπρος
spaCy NLP
hr
Croatian
Hrvatski
HrvatskaBosna i Hercegovina
spaCy NLP
sl
Slovenian
Slovenščina
Slovenija
spaCy NLP
mk
Macedonian
Македонски
Северна Македонија
spaCy NLP
sv
Swedish
Svenska
SverigeFinland
spaCy NLP
da
Danish
Dansk
Danmark
spaCy NLP
nb
Norwegian
Norsk
Norge
spaCy NLP
fi
Finnish
Suomi
Suomi
spaCy NLP
is
Icelandic
Íslenska
Ísland
XLM-RoBERTa
lt
Lithuanian
Lietuvių
Lietuva
spaCy NLP
lv
Latvian
Latviešu
Latvija
XLM-RoBERTa
et
Estonian
Eesti
Eesti
XLM-RoBERTa
ca
Catalan
Català
Espanya (Catalunya)Andorra
spaCy NLP
eu
Basque
Euskara
Espainia (Euskal Herria)Frantzia (Iparralde)
Stanza NLP

🌎Amerika2 mga wika

es
Spanish
Español
EspañaMéxicoColombiaArgentinaPerúChileVenezuelaEcuadorGuatemalaCubaBoliviaRepública DominicanaHondurasParaguayEl SalvadorNicaraguaCosta RicaPanamáUruguayGuinea Ecuatorial
spaCy NLP
pt
Portuguese
Português
BrasilPortugalAngolaMoçambiqueCabo VerdeGuiné-BissauSão Tomé e PríncipeTimor-Leste
spaCy NLP

🌍Aprika2 mga wika

sw
Swahili
Kiswahili
TanzaniaKenyaUgandaJamhuri ya Kidemokrasia ya KongoRwandaBurundiMsumbiji
XLM-RoBERTa
af
Afrikaans
Afrikaans
Suid-AfrikaNamibië
Stanza NLP

🌏Gitnang Silangan5 mga wika

arRTL
Arabic
العربية
المملكة العربية السعوديةمصرالإماراتالعراقسورياالأردنلبنانالكويتقطرالبحرينعُماناليمنليبياتونسالجزائرالمغربالسودان
XLM-RoBERTa
heRTL
Hebrew
עברית
ישראל
Stanza NLP
faRTL
Persian
فارسی
ایرانافغانستان (دری)تاجیکستان (تاجیکی)
XLM-RoBERTa
tr
Turkish
Türkçe
TürkiyeKıbrıs
XLM-RoBERTa
hy
Armenian
Հայերեն
Հայաստան
Stanza NLP

🌏Timog Asya3 mga wika

hi
Hindi
हिन्दी
भारत
XLM-RoBERTa
bn
Bengali
বাংলা
বাংলাদেশভারত (পশ্চিমবঙ্গ)
XLM-RoBERTa
urRTL
Urdu
اردو
پاکستانبھارت
XLM-RoBERTa

🌏Timog Silangang Asya5 mga wika

id
Indonesian
Bahasa Indonesia
Indonesia
Stanza NLP
ms
Malay
Bahasa Melayu
MalaysiaBrunei DarussalamSingapura
XLM-RoBERTa
tl
Tagalog
Tagalog
Pilipinas
XLM-RoBERTa
vi
Vietnamese
Tiếng Việt
Việt Nam
Stanza NLP
th
Thai
ไทย
ประเทศไทย
XLM-RoBERTa

🌏Silangang Asya3 mga wika

zh
Chinese
中文
中国台灣新加坡
spaCy NLP
ja
Japanese
日本語
日本
spaCy NLP
ko
Korean
한국어
대한민국조선민주주의인민공화국
spaCy NLP

Mga Tampok ng Maramihang Wika

Awtomatikong Pagtuklas

Awtomatikong kinikilala ng aming sistema ang wika ng iyong teksto at inilalapat ang naaangkop na mga modelo ng pagtuklas.

  • Sumusuporta sa 48 wika
  • Hindi na kailangan ng manwal na pagpili

Suporta sa Wikang RTL

Buong suporta para sa mga wikang kanan-pakaliwa na may wastong paghawak ng bidirectional na teksto.

  • Arabe, Hebreo, Persyano, Urdu
  • Tamang pagposisyon ng teksto

Matalinong Pagkarga ng Modelo

Ikinakarga ang mga modelong pang-wika kapag kailangan lang upang mabawasan ang paggamit ng memorya at mapahusay ang pagganap.

  • Ikinakarga lamang ang mga kailangang modelo
  • Nagke-cache ng hanggang 5 modelo

Industry Precision Benchmark — Feb 2026

Independent benchmarks on mixed-language datasets reveal a critical gap in multilingual PII detection across the industry.

Industry average

22.7% precision

3.4 false positives per real PII finding in mixed-language datasets

anonym.legal

285+ entity types

spaCy NLP engine across 48 languages — 419/419 test cases passing

Why precision matters in multilingual PII detection

Low precision means more false positives — legitimate data gets blocked, workflows break

Mixed-language documents (e.g., German contracts with English headers) require per-language NLP models — not a single global model

spaCy NER models trained per language outperform multilingual transformers on country-specific entity formats (PESEL, IBAN, BSN, etc.)

GDPR and regional data protection laws require correct identification — misidentification creates compliance risk

Mga Format na Partikular sa Bansa

Tinutukoy namin ang PII sa mga format na partikular sa bawat bansa at rehiyon.

Mga Format sa Europa

  • Alemanya: Personalausweis, Steuer-ID
  • Pransiya: NIR, Carte Nationale
  • Italya: Codice Fiscale
  • Espanya: DNI, NIE
  • Netherlands: BSN
  • Polandya: PESEL

Mga Pandaigdigang Format

  • US: SSN, Lisensya sa Pagmamaneho
  • UK: National Insurance
  • Canada: SIN
  • Australia: TFN, Medicare
  • Japan: My Number
  • India: Aadhaar, PAN

I-anonymize sa Anumang Wika

Magsimula sa 300 libreng token. Gumagana sa lahat ng 48 wika.

Lumikha ng Libreng Account