48 Bahasa. Satu Platform.

Deteksi dan anonimisasi PII dalam 48 bahasa dengan dukungan pola asli. Dukungan penuh RTL untuk Arab, Ibrani, Persia, dan Urdu.

48 Bahasa Didukung

Deteksi dan anonimisasi PII penuh di seluruh platform

🌍Eropa28 bahasa-bahasa

en
English
English
United KingdomIrelandMaltaUnited StatesCanadaAustraliaNew ZealandSouth AfricaNigeriaKenyaGhanaSingaporeJamaica
spaCy NLP
de
German
Deutsch
DeutschlandÖsterreichSchweizLuxemburgLiechtensteinBelgien
spaCy NLP
fr
French
Français
FranceBelgiqueSuisseLuxembourgMonacoSénégalCôte d'IvoireCamerounRépublique dém. du CongoMadagascarRwandaHaïtiCanada (Québec)
spaCy NLP
it
Italian
Italiano
ItaliaSan MarinoSvizzeraCittà del Vaticano
spaCy NLP
nl
Dutch
Nederlands
NederlandBelgiëSurinameArubaCuraçao
spaCy NLP
ru
Russian
Русский
РоссияБеларусьКазахстанКыргызстан
spaCy NLP
pl
Polish
Polski
Polska
spaCy NLP
uk
Ukrainian
Українська
Україна
spaCy NLP
cs
Czech
Čeština
Česká republika
Stanza NLP
sk
Slovak
Slovenčina
Slovensko
XLM-RoBERTa
hu
Hungarian
Magyar
Magyarország
Stanza NLP
bg
Bulgarian
Български
България
Stanza NLP
sr
Serbian
Српски
СрбијаБосна и Херцеговина
XLM-RoBERTa
ro
Romanian
Română
RomâniaRepublica Moldova
spaCy NLP
el
Greek
Ελληνικά
ΕλλάδαΚύπρος
spaCy NLP
hr
Croatian
Hrvatski
HrvatskaBosna i Hercegovina
spaCy NLP
sl
Slovenian
Slovenščina
Slovenija
spaCy NLP
mk
Macedonian
Македонски
Северна Македонија
spaCy NLP
sv
Swedish
Svenska
SverigeFinland
spaCy NLP
da
Danish
Dansk
Danmark
spaCy NLP
nb
Norwegian
Norsk
Norge
spaCy NLP
fi
Finnish
Suomi
Suomi
spaCy NLP
is
Icelandic
Íslenska
Ísland
XLM-RoBERTa
lt
Lithuanian
Lietuvių
Lietuva
spaCy NLP
lv
Latvian
Latviešu
Latvija
XLM-RoBERTa
et
Estonian
Eesti
Eesti
XLM-RoBERTa
ca
Catalan
Català
Espanya (Catalunya)Andorra
spaCy NLP
eu
Basque
Euskara
Espainia (Euskal Herria)Frantzia (Iparralde)
Stanza NLP

🌎Amerika2 bahasa-bahasa

es
Spanish
Español
EspañaMéxicoColombiaArgentinaPerúChileVenezuelaEcuadorGuatemalaCubaBoliviaRepública DominicanaHondurasParaguayEl SalvadorNicaraguaCosta RicaPanamáUruguayGuinea Ecuatorial
spaCy NLP
pt
Portuguese
Português
BrasilPortugalAngolaMoçambiqueCabo VerdeGuiné-BissauSão Tomé e PríncipeTimor-Leste
spaCy NLP

🌍Afrika2 bahasa-bahasa

sw
Swahili
Kiswahili
TanzaniaKenyaUgandaJamhuri ya Kidemokrasia ya KongoRwandaBurundiMsumbiji
XLM-RoBERTa
af
Afrikaans
Afrikaans
Suid-AfrikaNamibië
Stanza NLP

🌏Timur Tengah5 bahasa-bahasa

arRTL
Arabic
العربية
المملكة العربية السعوديةمصرالإماراتالعراقسورياالأردنلبنانالكويتقطرالبحرينعُماناليمنليبياتونسالجزائرالمغربالسودان
XLM-RoBERTa
heRTL
Hebrew
עברית
ישראל
Stanza NLP
faRTL
Persian
فارسی
ایرانافغانستان (دری)تاجیکستان (تاجیکی)
XLM-RoBERTa
tr
Turkish
Türkçe
TürkiyeKıbrıs
XLM-RoBERTa
hy
Armenian
Հայերեն
Հայաստան
Stanza NLP

🌏Asia Selatan3 bahasa-bahasa

hi
Hindi
हिन्दी
भारत
XLM-RoBERTa
bn
Bengali
বাংলা
বাংলাদেশভারত (পশ্চিমবঙ্গ)
XLM-RoBERTa
urRTL
Urdu
اردو
پاکستانبھارت
XLM-RoBERTa

🌏Asia Tenggara5 bahasa-bahasa

id
Indonesian
Bahasa Indonesia
Indonesia
Stanza NLP
ms
Malay
Bahasa Melayu
MalaysiaBrunei DarussalamSingapura
XLM-RoBERTa
tl
Tagalog
Tagalog
Pilipinas
XLM-RoBERTa
vi
Vietnamese
Tiếng Việt
Việt Nam
Stanza NLP
th
Thai
ไทย
ประเทศไทย
XLM-RoBERTa

🌏Asia Timur3 bahasa-bahasa

zh
Chinese
中文
中国台灣新加坡
spaCy NLP
ja
Japanese
日本語
日本
spaCy NLP
ko
Korean
한국어
대한민국조선민주주의인민공화국
spaCy NLP

Fitur Multi-Bahasa

Deteksi Otomatis

Sistem kami secara otomatis mengidentifikasi bahasa teks Anda dan menerapkan model deteksi yang sesuai.

  • Mendukung 48 bahasa
  • Tidak perlu pemilihan manual

Dukungan Bahasa RTL

Dukungan penuh untuk bahasa yang ditulis dari kanan ke kiri dengan penanganan teks dua arah yang tepat.

  • Arab, Ibrani, Persia, Urdu
  • Posisi teks yang benar

Pemodelan Cerdas

Model bahasa dimuat sesuai permintaan untuk meminimalkan penggunaan memori dan meningkatkan kinerja.

  • Hanya memuat model yang diperlukan
  • Menyimpan hingga 5 model

Industry Precision Benchmark — Feb 2026

Independent benchmarks on mixed-language datasets reveal a critical gap in multilingual PII detection across the industry.

Industry average

22.7% precision

3.4 false positives per real PII finding in mixed-language datasets

anonym.legal

285+ entity types

spaCy NLP engine across 48 languages — 419/419 test cases passing

Why precision matters in multilingual PII detection

Low precision means more false positives — legitimate data gets blocked, workflows break

Mixed-language documents (e.g., German contracts with English headers) require per-language NLP models — not a single global model

spaCy NER models trained per language outperform multilingual transformers on country-specific entity formats (PESEL, IBAN, BSN, etc.)

GDPR and regional data protection laws require correct identification — misidentification creates compliance risk

Format Khusus Negara

Kami mendeteksi PII dalam format yang spesifik untuk setiap negara dan wilayah.

Format Eropa

  • Jerman: Personalausweis, Steuer-ID
  • Prancis: NIR, Carte Nationale
  • Italia: Codice Fiscale
  • Spanyol: DNI, NIE
  • Belanda: BSN
  • Polandia: PESEL

Format Global

  • AS: SSN, SIM
  • Inggris: National Insurance
  • Kanada: SIN
  • Australia: TFN, Medicare
  • Jepang: My Number
  • India: Aadhaar, PAN

Anonimkan dalam Bahasa Apa Pun

Mulai dengan 300 token gratis. Bekerja dengan semua 48 bahasa.

Buat Akun Gratis