Quay lại BlogKỹ Thuật

Thuế Dương Tính Giả: Tác Động Của Độ Chính Xác Phát...

Công cụ phát hiện PII có độ chính xác 95% vẫn tạo ra một yêu cầu kiểm tra thủ công trên 5.000 bản ghi.

April 3, 20268 phút đọc
false positive ratePresidio precisionPII detection accuracyscore threshold configurationhybrid detection

Thuế Dương Tính Giả: Tác Động Của Độ Chính Xác Phát Hiện PII Đến Hiệu Suất

Công cụ phát hiện PII có độ chính xác 95% vẫn tạo ra khoảng 2.500 dương tính giả trên 50.000 bản ghi:

50,000 × (1 - 0.95) = 2,500 dương tính giả

Mỗi dương tính giả yêu cầu kiểm tra thủ công. Chi phí nhân công của việc tô sáng thủ công là 0,50 USD mỗi bản ghi:

2,500 × $0.50 = $1,250

Ngoài ra, những dương tính giả này tạo ra ba vấn đề bổ sung:

  1. Nhiễu: Lực lượng lao động nhân sự bị choáng ngợp bởi dương tính giả, dẫn đến kiểm tra không đầy đủ.
  2. Lệch đơn hình lập phương: Mô hình tự động học cách nhận dạng "dương tính giả thường xuyên" và giảm độ nhạy cảm trên các mẫu tương tự.
  3. Đánh giá thấp rủi ro: Độ chính xác được đo lường trên tập dữ liệu đào tạo (mà công cụ đã từng thấy), không phải trên tập dữ liệu kiểm tra bên ngoài.

Độ Chính Xác Thực Tế Cao Hơn Độ Chính Xác Được Báo Cáo

Công cụ phát hiện PII báo cáo độ chính xác 95% có thể hoạt động ở mức 99,8% trong thực tế bằng cách:

  1. Lọc điểm số tin cậy: Chỉ xử lý (ẩn danh hóa hoặc xóa) các kết quả với điểm tin cậy > 0,95. Những gì nằm dưới ngưỡng đó được gắn cờ cho kiểm tra thủ công.
  2. Xác thực mạng: Sử dụng các mô hình thứ cấp để xác thực các phát hiện của mô hình chính.
  3. Quy tắc doanh nghiệp: Thêm quy tắc doanh nghiệp cụ thể biết về các cạm bẫy của bộ dữ liệu của bạn.

Sẵn sàng bảo vệ dữ liệu của bạn?

Bắt đầu ẩn danh PII với 285+ loại thực thể trên 48 ngôn ngữ.