Cách anonym.legal Hoạt Động
Phát hiện PII dựa trên regex, có tính xác định, mang lại kết quả có thể tái tạo 100%. Đầu vào giống nhau, đầu ra giống nhau—mỗi lần. Không AI, không đoán, chỉ là khớp mẫu minh bạch.
How Does PII Detection Work?
PII detection identifies personal data in text using pattern matching and machine learning. anonym.legal uses a hybrid approach:
- 1Pattern Matching: Regex patterns detect structured data (SSNs, credit cards, IBANs) with checksum validation.
- 2Named Entity Recognition: NER models identify names, locations, and organizations in 48 languages.
- 3Context Scoring: Each detection is scored based on surrounding context to minimize false positives.
This hybrid approach detects 285+ entity types while maintaining deterministic, reproducible results — essential for compliance and legal discovery.
Tại Sao Dùng Regex, Không Phải AI?
Cách Tiếp Cận Của Chúng Tôi
- Kết quả có thể tái tạo 100%
- Hoàn toàn có thể kiểm toán để tuân thủ
- Không cần dữ liệu huấn luyện
- Quyết định minh bạch
- Hiệu suất nhanh, có thể dự đoán
- Không có sự trôi mô hình theo thời gian
Cách Tiếp Cận AI/ML
- Kết quả thay đổi giữa các lần chạy
- Quyết định hộp đen
- Cần dữ liệu huấn luyện
- Khó kiểm toán
- Chi phí tính toán cao hơn
- Trôi mô hình theo thời gian
Quy Trình 10 Bước
Từ đầu vào đến đầu ra, đây chính xác là những gì xảy ra với tài liệu của bạn
Văn Bản Đầu Vào
Gửi tài liệu của bạn qua giao diện web, API, hoặc Add-in Office
Phát Hiện Ngôn Ngữ
Hệ thống xác định ngôn ngữ của tài liệu để xử lý tối ưu
Phân Tách
Văn bản được chia thành các token để khớp mẫu
Khớp Mẫu
Các mẫu regex quét hơn 50 loại thực thể
Phân Tích Ngữ Cảnh
Văn bản xung quanh cải thiện độ chính xác phát hiện
Điểm Tin Cậy
Mỗi phát hiện nhận được một điểm tin cậy
Phân Loại Thực Thể
Các mục đã phát hiện được phân loại theo loại
Xem Kết Quả
Xem tất cả các phát hiện với vị trí và điểm số
Áp Dụng Ẩn Danh
Chọn phương pháp của bạn: Thay thế, Đánh dấu, Băm, Mã hóa, hoặc Che giấu
Tài Liệu Đầu Ra
Tải xuống tài liệu đã ẩn danh của bạn
Máy Chủ MCP: Tích Hợp AI Tập Trung Vào Quyền Riêng Tư
Cách dữ liệu của bạn chảy qua Máy Chủ MCP để giữ cho các công cụ AI an toàn
Yêu Cầu Công Cụ AI
Công cụ AI của bạn (Cursor, Claude) gửi một yêu cầu chứa PII
Máy Chủ MCP Chặn Lại
Máy chủ phân tích và phát hiện tất cả các thực thể PII
Ẩn Danh
PII được thay thế bằng các token hoặc bị đánh dấu
Xử Lý AI
AI nhận và xử lý chỉ dữ liệu đã ẩn danh
Trả Về Phản Hồi
Phản hồi AI quay lại qua Máy Chủ MCP
Giải Mã Token
Tùy chọn: Giá trị gốc được khôi phục cho người dùng
Ví Dụ Thực Tế
Xử lý thanh toán cho John Doe, email john@example.com, thẻ 4532-1111-2222-3333Những gì AI thấy
Xử lý thanh toán cho PII_PERSON_001, email PII_EMAIL_001, thẻ PII_CREDIT_CARD_001Những gì bạn nhận lại
Frequently Asked Questions
Why use regex instead of AI for PII detection?
Regex-based detection is deterministic and reproducible. The same input always produces the same output. AI/ML models can be unpredictable and may miss or falsely flag data. For compliance, reproducibility matters.
How accurate is the detection?
Our hybrid approach combines regex patterns with Named Entity Recognition (NER) for high accuracy. All patterns include checksum validation where applicable (credit cards, IBANs, SSNs). False positives are minimized through context-aware scoring.
What happens to my data during processing?
Text is sent to our EU-hosted servers (Hetzner, Germany) over TLS 1.3 for analysis. We don't store your data after processing. With Zero-Knowledge auth, we can't even identify which user made the request.
Can I add custom entity types?
Yes! You can create custom recognizers with your own regex patterns and context words. Custom entities support the same operators (replace, mask, hash, encrypt, redact) as built-in types.
How does reversible encryption work?
The Encrypt operator uses AES-256-GCM encryption with your key. Only you can decrypt. This allows re-identification for audits or legal discovery while keeping data protected in transit and storage.
Xem Nó Trong Hành Động
Thử phát hiện và ẩn danh PII của chúng tôi miễn phí với 200 token mỗi chu kỳ.