检测工作原理
模式匹配
为每种实体类型使用精心制作的正则表达式模式,确保在所有文档中结果一致且可预测。
置信度评分
每次检测都包括基于模式强度和上下文的置信度评分(0-1),帮助您过滤结果。
上下文意识
周围文本上下文提高了检测准确性,减少了误报,同时捕捉边缘案例。
Supported Entity Types
Comprehensive coverage of personal information types across categories
Personal Identifiers
- Person Names
- Email Addresses
- Phone Numbers
- Date of Birth
- Age
- Gender
- Nationality
Financial Information
- Credit Card Numbers
- IBAN
- BIC/SWIFT
- Bank Account Numbers
- Tax IDs
- VAT Numbers
Government IDs
- Social Security Numbers (SSN)
- National ID Numbers
- Passport Numbers
- Driver's License
- Health Insurance IDs
Location Data
- Street Addresses
- Cities
- ZIP/Postal Codes
- Countries
- GPS Coordinates
Digital Identifiers
- IP Addresses (v4/v6)
- MAC Addresses
- URLs
- Domain Names
- User IDs
Organization Data
- Company Names
- Organization IDs
- Registration Numbers
- Department Names
Temporal Data
- Dates
- Times
- Date Ranges
- Timestamps
International Formats
- German ID (Personalausweis)
- UK National Insurance
- Spanish DNI/NIE
- Italian Codice Fiscale
- And 20+ more country-specific formats
自定义实体支持
需要检测自定义模式?使用正则表达式模式创建您自己的实体类型,或使用我们的 AI 辅助模式生成器。
手动模式创建
为专有标识符定义正则表达式模式,如内部员工 ID、项目代码或自定义参考编号。
AI 模式生成器
用简单的语言描述您想要检测的内容,我们的 AI 将为您生成优化的正则表达式模式。