Cách anonym.legal Hoạt Động

Phát hiện PII dựa trên regex, có tính xác định, mang lại kết quả có thể tái tạo 100%. Đầu vào giống nhau, đầu ra giống nhau—mỗi lần. Không AI, không đoán, chỉ là khớp mẫu minh bạch.

How Does PII Detection Work?

PII detection identifies personal data in text using pattern matching and machine learning. anonym.legal uses a hybrid approach:

  1. 1
    Pattern Matching: Regex patterns detect structured data (SSNs, credit cards, IBANs) with checksum validation.
  2. 2
    Named Entity Recognition: NER models identify names, locations, and organizations in 48 languages.
  3. 3
    Context Scoring: Each detection is scored based on surrounding context to minimize false positives.

This hybrid approach detects 285+ entity types while maintaining deterministic, reproducible results — essential for compliance and legal discovery.

Tại Sao Dùng Regex, Không Phải AI?

Cách Tiếp Cận Của Chúng Tôi

  • Kết quả có thể tái tạo 100%
  • Hoàn toàn có thể kiểm toán để tuân thủ
  • Không cần dữ liệu huấn luyện
  • Quyết định minh bạch
  • Hiệu suất nhanh, có thể dự đoán
  • Không có sự trôi mô hình theo thời gian

Cách Tiếp Cận AI/ML

  • Kết quả thay đổi giữa các lần chạy
  • Quyết định hộp đen
  • Cần dữ liệu huấn luyện
  • Khó kiểm toán
  • Chi phí tính toán cao hơn
  • Trôi mô hình theo thời gian

Quy Trình 10 Bước

Từ đầu vào đến đầu ra, đây chính xác là những gì xảy ra với tài liệu của bạn

1

Văn Bản Đầu Vào

Gửi tài liệu của bạn qua giao diện web, API, hoặc Add-in Office

2

Phát Hiện Ngôn Ngữ

Hệ thống xác định ngôn ngữ của tài liệu để xử lý tối ưu

3

Phân Tách

Văn bản được chia thành các token để khớp mẫu

4

Khớp Mẫu

Các mẫu regex quét hơn 50 loại thực thể

5

Phân Tích Ngữ Cảnh

Văn bản xung quanh cải thiện độ chính xác phát hiện

6

Điểm Tin Cậy

Mỗi phát hiện nhận được một điểm tin cậy

7

Phân Loại Thực Thể

Các mục đã phát hiện được phân loại theo loại

8

Xem Kết Quả

Xem tất cả các phát hiện với vị trí và điểm số

9

Áp Dụng Ẩn Danh

Chọn phương pháp của bạn: Thay thế, Đánh dấu, Băm, Mã hóa, hoặc Che giấu

10

Tài Liệu Đầu Ra

Tải xuống tài liệu đã ẩn danh của bạn

Chỉ có sẵn trên các gói Pro và Business

Máy Chủ MCP: Tích Hợp AI Tập Trung Vào Quyền Riêng Tư

Cách dữ liệu của bạn chảy qua Máy Chủ MCP để giữ cho các công cụ AI an toàn

1

Yêu Cầu Công Cụ AI

Công cụ AI của bạn (Cursor, Claude) gửi một yêu cầu chứa PII

2

Máy Chủ MCP Chặn Lại

Máy chủ phân tích và phát hiện tất cả các thực thể PII

3

Ẩn Danh

PII được thay thế bằng các token hoặc bị đánh dấu

Safe data only
4

Xử Lý AI

AI nhận và xử lý chỉ dữ liệu đã ẩn danh

5

Trả Về Phản Hồi

Phản hồi AI quay lại qua Máy Chủ MCP

6
Optional

Giải Mã Token

Tùy chọn: Giá trị gốc được khôi phục cho người dùng

Ví Dụ Thực Tế

Trước (có PII)
Xử lý thanh toán cho John Doe, email john@example.com, thẻ 4532-1111-2222-3333

Những gì AI thấy

Sau (đã ẩn danh)
Xử lý thanh toán cho PII_PERSON_001, email PII_EMAIL_001, thẻ PII_CREDIT_CARD_001

Những gì bạn nhận lại

AI không bao giờ thấy PII thực của bạn
Có thể đảo ngược với chế độ phân tách
Chi phí token giống như ứng dụng web
Hoạt động với nhiều công cụ AI
Bảo mật cấp doanh nghiệp

Frequently Asked Questions

Why use regex instead of AI for PII detection?

Regex-based detection is deterministic and reproducible. The same input always produces the same output. AI/ML models can be unpredictable and may miss or falsely flag data. For compliance, reproducibility matters.

How accurate is the detection?

Our hybrid approach combines regex patterns with Named Entity Recognition (NER) for high accuracy. All patterns include checksum validation where applicable (credit cards, IBANs, SSNs). False positives are minimized through context-aware scoring.

What happens to my data during processing?

Text is sent to our EU-hosted servers (Hetzner, Germany) over TLS 1.3 for analysis. We don't store your data after processing. With Zero-Knowledge auth, we can't even identify which user made the request.

Can I add custom entity types?

Yes! You can create custom recognizers with your own regex patterns and context words. Custom entities support the same operators (replace, mask, hash, encrypt, redact) as built-in types.

How does reversible encryption work?

The Encrypt operator uses AES-256-GCM encryption with your key. Only you can decrypt. This allows re-identification for audits or legal discovery while keeping data protected in transit and storage.

Xem Nó Trong Hành Động

Thử phát hiện và ẩn danh PII của chúng tôi miễn phí với 200 token mỗi chu kỳ.