Các công cụ PII tạo sẵn từ Mỹ (Google Presidio, Microsoft, AWS Macie) được thiết kế để phát hiện các định danh mỹ (SSN, ITIN) và một số định danh bảo hiểm quốc tế. Nhưng chúng bỏ lỏ khoảng cách ở các định danh quốc gia EU.
Steuer-ID Đức (Steuernummer)
Định Dạng: 11 chữ số, không có dấu phân cách (ví dụ: 12345678901).
Cấu Trúc: Mã bộ phận thuế + số đăng ký + chữ số kiểm tra (modulus-11).
Phạm Vi: Cấp phát cho tất cả các cư dân Đức, công ty và tổ chức tự trị từ khi sinh hoặc đăng ký.
Vấn Đề Phát Hiện: Presidio không có bộ phát hiện Steuer-ID. Google tìm kiếm "11 chữ số liên tiếp" nhưng không xác thực chữ số kiểm tra.
NIR Pháp (Numéro d'Inscription au Répertoire)
Định Dạng: 13 chữ số (ví dụ: 1234567890123).
Cấu Trúc: Giới tính (1 chữ số) + năm sinh (2 chữ số) + tháng sinh (2 chữ số) + tỉnh sinh (2 hoặc 3 chữ số) + mã đăng ký + chữ số kiểm tra (modulus-97).
Vấn Đề Phát Hiện: Khi Presidio thấy 13 chữ số, nó không xác thực cấu trúc cụ thể hay chữ số kiểm tra. Kết quả: dương tính giả cao.
Personnummer Thụy Điển
Định Dạng: 12 chữ số (ví dụ: 121212-1234 hoặc 19121212-1234), với dấu gạch ngang như phân tách tùy chọn.
Cấu Trúc: Ngày sinh (YYMMDD) + mã người + kiểm tra (Luhn algorithm).
Phạm Vi: Cấp phát cho tất cả người sinh ở Thụy Điển hoặc sống ở đó lâu dài.
Sources: