48 Hizkuntza. Plataforma Bat.

48 hizkuntzatan PII detektatu eta anonimizatu, patroi natiboen laguntzarekin. Arabiako, hebreerako, persiarako eta urdurako RTL laguntza osoa.

48 Hizkuntza Babestuta

Plataforma osoan PII detekzio eta anonimizazio osoa

🌍Europa28 hizkuntzak

en
English
English
United KingdomIrelandMaltaUnited StatesCanadaAustraliaNew ZealandSouth AfricaNigeriaKenyaGhanaSingaporeJamaica
spaCy NLP
de
German
Deutsch
DeutschlandÖsterreichSchweizLuxemburgLiechtensteinBelgien
spaCy NLP
fr
French
Français
FranceBelgiqueSuisseLuxembourgMonacoSénégalCôte d'IvoireCamerounRépublique dém. du CongoMadagascarRwandaHaïtiCanada (Québec)
spaCy NLP
it
Italian
Italiano
ItaliaSan MarinoSvizzeraCittà del Vaticano
spaCy NLP
nl
Dutch
Nederlands
NederlandBelgiëSurinameArubaCuraçao
spaCy NLP
ru
Russian
Русский
РоссияБеларусьКазахстанКыргызстан
spaCy NLP
pl
Polish
Polski
Polska
spaCy NLP
uk
Ukrainian
Українська
Україна
spaCy NLP
cs
Czech
Čeština
Česká republika
Stanza NLP
sk
Slovak
Slovenčina
Slovensko
XLM-RoBERTa
hu
Hungarian
Magyar
Magyarország
Stanza NLP
bg
Bulgarian
Български
България
Stanza NLP
sr
Serbian
Српски
СрбијаБосна и Херцеговина
XLM-RoBERTa
ro
Romanian
Română
RomâniaRepublica Moldova
spaCy NLP
el
Greek
Ελληνικά
ΕλλάδαΚύπρος
spaCy NLP
hr
Croatian
Hrvatski
HrvatskaBosna i Hercegovina
spaCy NLP
sl
Slovenian
Slovenščina
Slovenija
spaCy NLP
mk
Macedonian
Македонски
Северна Македонија
spaCy NLP
sv
Swedish
Svenska
SverigeFinland
spaCy NLP
da
Danish
Dansk
Danmark
spaCy NLP
nb
Norwegian
Norsk
Norge
spaCy NLP
fi
Finnish
Suomi
Suomi
spaCy NLP
is
Icelandic
Íslenska
Ísland
XLM-RoBERTa
lt
Lithuanian
Lietuvių
Lietuva
spaCy NLP
lv
Latvian
Latviešu
Latvija
XLM-RoBERTa
et
Estonian
Eesti
Eesti
XLM-RoBERTa
ca
Catalan
Català
Espanya (Catalunya)Andorra
spaCy NLP
eu
Basque
Euskara
Espainia (Euskal Herria)Frantzia (Iparralde)
Stanza NLP

🌎Amerikak2 hizkuntzak

es
Spanish
Español
EspañaMéxicoColombiaArgentinaPerúChileVenezuelaEcuadorGuatemalaCubaBoliviaRepública DominicanaHondurasParaguayEl SalvadorNicaraguaCosta RicaPanamáUruguayGuinea Ecuatorial
spaCy NLP
pt
Portuguese
Português
BrasilPortugalAngolaMoçambiqueCabo VerdeGuiné-BissauSão Tomé e PríncipeTimor-Leste
spaCy NLP

🌍Afrika2 hizkuntzak

sw
Swahili
Kiswahili
TanzaniaKenyaUgandaJamhuri ya Kidemokrasia ya KongoRwandaBurundiMsumbiji
XLM-RoBERTa
af
Afrikaans
Afrikaans
Suid-AfrikaNamibië
Stanza NLP

🌏Hurbil Ekialdea5 hizkuntzak

arRTL
Arabic
العربية
المملكة العربية السعوديةمصرالإماراتالعراقسورياالأردنلبنانالكويتقطرالبحرينعُماناليمنليبياتونسالجزائرالمغربالسودان
XLM-RoBERTa
heRTL
Hebrew
עברית
ישראל
Stanza NLP
faRTL
Persian
فارسی
ایرانافغانستان (دری)تاجیکستان (تاجیکی)
XLM-RoBERTa
tr
Turkish
Türkçe
TürkiyeKıbrıs
XLM-RoBERTa
hy
Armenian
Հայերեն
Հայաստան
Stanza NLP

🌏Hego Asia3 hizkuntzak

hi
Hindi
हिन्दी
भारत
XLM-RoBERTa
bn
Bengali
বাংলা
বাংলাদেশভারত (পশ্চিমবঙ্গ)
XLM-RoBERTa
urRTL
Urdu
اردو
پاکستانبھارت
XLM-RoBERTa

🌏Hego-ekialde Asia5 hizkuntzak

id
Indonesian
Bahasa Indonesia
Indonesia
Stanza NLP
ms
Malay
Bahasa Melayu
MalaysiaBrunei DarussalamSingapura
XLM-RoBERTa
tl
Tagalog
Tagalog
Pilipinas
XLM-RoBERTa
vi
Vietnamese
Tiếng Việt
Việt Nam
Stanza NLP
th
Thai
ไทย
ประเทศไทย
XLM-RoBERTa

🌏Ekialde Asia3 hizkuntzak

zh
Chinese
中文
中国台灣新加坡
spaCy NLP
ja
Japanese
日本語
日本
spaCy NLP
ko
Korean
한국어
대한민국조선민주주의인민공화국
spaCy NLP

Hizkuntza Anitzeko Ezaugarriak

Detekzio Automatikoa

Gure sistema automatikoki identifikatzen du zure testuaren hizkuntza eta aplikatzen ditu egokiak detekzio modeloak.

  • 48 hizkuntza babesten ditu
  • Ez da beharrezkoa hautaketa eskuzkoa

RTL Hizkuntzen Laguntza

Eskuinetik ezkerrera doazen hizkuntzen laguntza osoa, testu bi norabidunaren kudeaketa egokiarekin.

  • Arabiera, Hebreera, Persiera, Urdu
  • Testuaren posizionamendu zuzena

Modelo Adimentsua Kargatzea

Hizkuntza modeloak eskaeraren arabera kargatzen dira, memoria erabilera minimizatzeko eta errendimendua hobetzeko.

  • Beharrezko modeloak bakarrik kargatzen ditu
  • 5 modelora arte cache egiten du

Industry Precision Benchmark — Feb 2026

Independent benchmarks on mixed-language datasets reveal a critical gap in multilingual PII detection across the industry.

Industry average

22.7% precision

3.4 false positives per real PII finding in mixed-language datasets

anonym.legal

285+ entity types

spaCy NLP engine across 48 languages — 419/419 test cases passing

Why precision matters in multilingual PII detection

Low precision means more false positives — legitimate data gets blocked, workflows break

Mixed-language documents (e.g., German contracts with English headers) require per-language NLP models — not a single global model

spaCy NER models trained per language outperform multilingual transformers on country-specific entity formats (PESEL, IBAN, BSN, etc.)

GDPR and regional data protection laws require correct identification — misidentification creates compliance risk

Herrialdeko Formatu Espezifikoak

PII detektatzen dugu herrialde eta eskualde bakoitzari espezifikoak diren formatuetan.

Europako Formatuak

  • Alemania: Personalausweis, Steuer-ID
  • Frantzia: NIR, Carte Nationale
  • Italia: Codice Fiscale
  • Espainia: DNI, NIE
  • Herbehereak: BSN
  • Polonia: PESEL

Global Formatuak

  • AEB: SSN, gidabaimena
  • Erresuma Batua: National Insurance
  • Kanada: SIN
  • Australia: TFN, Medicare
  • Japonia: My Number
  • India: Aadhaar, PAN

Anonimizatu Edozein Hizkuntzatan

200 token doan hasi. 48 hizkuntza guztiekin funtzionatzen du.

Sortu Kontu Doan