지원되는 48개 언어
전체 플랫폼에서 완전한 PII 탐지 및 익명화
🌍유럽— 28 언어들
🌎아메리카— 2 언어들
🌍아프리카— 2 언어들
🌏중동— 5 언어들
🌏남아시아— 3 언어들
🌏동남아시아— 5 언어들
🌏동아시아— 3 언어들
다국어 기능
자동 감지
저희 시스템은 귀하의 텍스트 언어를 자동으로 식별하고 적절한 감지 모델을 적용합니다.
- 48개 언어 지원
- 수동 선택 필요 없음
RTL 언어 지원
양방향 텍스트 처리를 통해 오른쪽에서 왼쪽으로 쓰는 언어를 완벽하게 지원합니다.
- 아랍어, 히브리어, 페르시아어, 우르두어
- 올바른 텍스트 위치
스마트 모델 로딩
메모리 사용을 최소화하고 성능을 개선하기 위해 필요에 따라 언어 모델을 로드합니다.
- 필요한 모델만 로드
- 최대 5개 모델 캐시
Industry Precision Benchmark — Feb 2026
Independent benchmarks on mixed-language datasets reveal a critical gap in multilingual PII detection across the industry.
Industry average
22.7% precision
3.4 false positives per real PII finding in mixed-language datasets
anonym.legal
285+ entity types
spaCy NLP engine across 48 languages — 419/419 test cases passing
Why precision matters in multilingual PII detection
Low precision means more false positives — legitimate data gets blocked, workflows break
Mixed-language documents (e.g., German contracts with English headers) require per-language NLP models — not a single global model
spaCy NER models trained per language outperform multilingual transformers on country-specific entity formats (PESEL, IBAN, BSN, etc.)
GDPR and regional data protection laws require correct identification — misidentification creates compliance risk
국가별 형식
각 국가 및 지역에 특정한 형식에서 PII를 감지합니다.
유럽 형식
- 독일: Personalausweis, Steuer-ID
- 프랑스: NIR, Carte Nationale
- 이탈리아: Codice Fiscale
- 스페인: DNI, NIE
- 네덜란드: BSN
- 폴란드: PESEL
전 세계 형식
- 미국: SSN, 운전면허증
- 영국: 국민 보험
- 캐나다: SIN
- 호주: TFN, Medicare
- 일본: My Number
- 인도: Aadhaar, PAN