By · Last updated 2026-03-25

Quay lại BlogGDPR & Tuân Thủ

Một Công Cụ, 45 Quốc Gia: 260+ Loại Dữ Liệu

CPF của Brazil có chữ số kiểm tra. PAN của Ấn Độ gồm 10 ký tự chữ và số. IBAN của EU thay đổi theo từng quốc gia. Các nền tảng thương mại điện tử toàn cầu không thể dùng nhiều công cụ riêng biệt.

March 25, 20267 phút đọc
global PII compliance260 entity typesBrazilian CPFIndian PANIBAN formats

Một Công Cụ, 45 Quốc Gia: 260+ Loại Dữ Liệu

Các nền tảng toàn cầu xử lý dữ liệu cá nhân từ nhiều quốc gia cùng lúc. Mỗi quốc gia có định dạng ID riêng. Mỗi định dạng có quy tắc riêng. Một công cụ phát hiện duy nhất phải xử lý tất cả. Hầu hết các công cụ không làm được điều đó.

Vấn Đề Phân Mảnh Định Danh

Một sàn giao dịch có người bán ở 45 quốc gia nhận được các loại tài liệu đăng ký rất khác nhau. Người bán Brazil nộp CPF. Số này có 11 chữ số. Hai chữ số là chữ số kiểm tra. Chúng dùng công thức trọng số cụ thể. Người bán Ấn Độ nộp PAN. Số này có 10 ký tự. Chữ cái và chữ số xuất hiện ở các vị trí cố định. Người bán Đức nộp Steuer-ID. Số này có 11 chữ số và kiểm tra Luhn. Người bán Hà Lan nộp BSN. Số này có 9 chữ số và dùng xác thực mod-11.

Mỗi định dạng có độ dài và cấu trúc khác nhau. Một biểu thức chính quy được xây dựng cho một định dạng sẽ không khớp với các định dạng khác. Mẫu rộng "10-12 chữ số" bắt quá nhiều. Nó gắn cờ giá cả, ngày tháng và số tham chiếu. Kết quả dương tính giả tăng nhanh theo quy mô.

Khoảng Trống 40 Định Danh

Hầu hết các công cụ PII doanh nghiệp đi kèm khoảng 40 loại định danh. Các loại phổ biến bao gồm:

  • Số An Sinh Xã Hội Hoa Kỳ
  • Định dạng hộ chiếu Hoa Kỳ
  • Bằng lái xe Hoa Kỳ
  • Định dạng thẻ tín dụng chung có xác thực Luhn
  • Địa chỉ email
  • Số điện thoại theo định dạng NANP
  • Địa chỉ IP

Các loại này đáp ứng tốt nhu cầu tuân thủ tại Bắc Mỹ. Chúng không đủ cho hoạt động toàn cầu.

Khoảng Trống Nhìn Theo Khu Vực

Nam Mỹ: CPF và CNPJ của Brazil dùng thuật toán kiểm tra từ cơ quan thuế Brazil. CUIT của Argentina dùng công thức tổng trọng số khác. NIT của Colombia có phương pháp xác thực riêng. Không có định dạng nào khớp với mẫu Hoa Kỳ.

Châu Á: PAN, Aadhaar, GSTIN và Voter ID của Ấn Độ mỗi loại có định dạng riêng. My Number của Nhật Bản có 12 chữ số. Số đăng ký cư trú của Hàn Quốc và chứng minh nhân dân quốc gia Trung Quốc đều cần bộ nhận dạng riêng.

Các quốc gia thành viên EU: Bảo phủ đầy đủ EU cần định dạng IBAN cho tất cả 27 quốc gia thành viên. Mỗi nước có độ dài và định dạng riêng theo quốc gia. Ngoài ra còn cần mỗi định dạng ID quốc gia. Điều này bao gồm Steuer-ID của Đức, NIR của Pháp, BSN của Hà Lan, PESEL của Ba Lan và Personnummer của Thụy Điển. Cũng bao gồm EMŠO của Slovenia, OIB của Croatia, EGN của Bulgaria và CNP của Romania.

Thư Viện 260+ Loại Thực Thể Bao Gồm Gì

Thư viện 260+ thực thể bao gồm tất cả ID quốc gia của 27 quốc gia thành viên EU. Nó xác thực tất cả định dạng IBAN của EU. Nó bao gồm ID Nam Mỹ: CPF và CNPJ Brazil, CUIT Argentina, NIT Colombia. Nó bao gồm ID châu Á: PAN, Aadhaar, GSTIN Ấn Độ, My Number Nhật Bản, RRN Hàn Quốc. Nó bao gồm ID UK: Số NI, NHS Number, các biến thể NINO. Nó bao gồm ID y tế: NPI Hoa Kỳ, số DEA, định dạng MRN bệnh viện. Nó bao gồm ID tài chính: mã SWIFT, định dạng BIC, mẫu số tài khoản.

Tại Sao Độ Phủ Phát Hiện Là Câu Hỏi Tuân Thủ

Mỗi khung pháp lý yêu cầu các định danh của nó phải được tìm thấy và bảo vệ. GDPR bao gồm dữ liệu người bán EU. LGPD bao gồm dữ liệu người bán Brazil. Đạo luật DPDP của Ấn Độ bao gồm dữ liệu người bán Ấn Độ.

"Bảo vệ thích hợp" có nghĩa là công cụ đã tìm thấy định danh. Bỏ sót Aadhaar không phải là lỗi cấu hình. Đó là lỗi phủ sóng. Với các nền tảng toàn cầu, khoảng trống đó là sự khác biệt giữa tuân thủ một phần và bảo vệ thực sự.

Một triển khai duy nhất với 260+ phạm vi thực thể xử lý tất cả các khu vực pháp lý này. Không cần công cụ khu vực riêng biệt. Không cần pipeline xử lý riêng. Không cần bổ sung thủ công cho các định dạng mà công cụ 40 nhận dạng bỏ sót.

Để biết thêm chi tiết về cách phủ sóng ánh xạ tới nghĩa vụ GDPR, xem tài nguyên tuân thủ GDPR. Để biết về chính sách kiểm toán và cập nhật, xem chi tiết bảo mật và tuân thủ.

Nguồn Tham Khảo

Sẵn sàng bảo vệ dữ liệu của bạn?

Bắt đầu ẩn danh PII với 285+ loại thực thể trên 48 ngôn ngữ.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.