By · Last updated 2026-06-01

Quay lại BlogGDPR & Tuân Thủ

ID quốc gia EU mà công cụ PII của bạn bỏ sót

Steueridentifikationsnummer của Đức, Numéro fiscal của Pháp, Codice Fiscale của Ý, NIF/NIE của Tây Ban Nha — công cụ PII tập trung vào Mỹ dễ dàng phát hiện SSN nhưng bỏ sót hầu hết các định danh EU.

June 1, 20267 phút đọc
EU national identifiersSteueridentifikationsnummerCodice FiscaleNIFmultinational GDPRtax ID detection

ID Quốc Gia EU Mà Công Cụ PII Của Bạn Bỏ Sót

Số thuế rất nhạy cảm. Chúng xuất hiện trên phiếu lương, biểu mẫu thuế và đơn xin vay ngân hàng. Nếu chúng bị rò rỉ, chúng cho phép gian lận và đánh cắp danh tính.

GDPR coi chúng là dữ liệu cá nhân. Rủi ro thực tế của chúng cao. Mỗi quốc gia EU sử dụng định dạng định danh quốc gia riêng. Hầu hết công cụ PII được xây dựng cho thị trường Mỹ hoặc Anh. Chúng dễ dàng tìm SSN và NINO. Chúng thường bỏ sót Steueridentifikationsnummer, Codice Fiscale và BSN. Đây là các định dạng mà các nhóm châu Âu xử lý hàng ngày.

Bức Tranh ID Thuế EU

Mỗi quốc gia EU có định dạng riêng. Đây là những định dạng phổ biến nhất.

Đức — Steueridentifikationsnummer

Steuer-ID là 11 chữ số. Nó được cấp từ khi sinh. Chữ số đầu tiên là 1–9 (không bao giờ là 0). Không có ba chữ số giống nhau liên tiếp. Ví dụ: 12345678901. Steuernummer cũng được sử dụng: 10–11 chữ số, định dạng thay đổi theo tiểu bang.

Pháp — Numéro fiscal de référence

SPI là 13 chữ số. DGFiP, cơ quan thuế Pháp, cấp nó. Trong tài liệu thuế, nó xuất hiện là "Identifiant fiscal."

Ý — Codice Fiscale

Codice Fiscale là 16 ký tự chữ và số. Nó mã hóa họ, tên, năm sinh, tháng sinh, ngày sinh và thành phố. Ví dụ: RSSMRA85M01H501Z. Định dạng có thể xác thực bằng tổng kiểm tra.

Tây Ban Nha — NIF và NIE

Công dân Tây Ban Nha dùng số DNI cộng chữ cái kiểm tra: 8 chữ số + chữ cái, ví dụ 12345678A. Người nước ngoài cư trú dùng NIE: tiền tố X/Y/Z + 7 chữ số + chữ cái kiểm tra, ví dụ X1234567A. Các thực thể dùng CIF: chữ cái + 8 chữ số, ví dụ B12345678.

Hà Lan — BSN

BSN (Burgerservicenummer) là 9 chữ số. Nó dùng thuật toán kiểm tra 11-proef. Nó rất phổ biến trong tài liệu lương và phúc lợi.

Ba Lan — PESEL

PESEL là 11 chữ số. 6 chữ số đầu mã hóa ngày sinh. Các chữ số cuối mã hóa giới tính và thứ tự.

Bỉ — Numéro de registre national

RN là 11 chữ số. Nó mã hóa ngày sinh, thứ tự và chữ số kiểm tra.

Bồ Đào Nha — NIF

NIF Bồ Đào Nha (Número de Identificação Fiscal) là 9 chữ số với chữ số kiểm tra. Chữ viết tắt giống Tây Ban Nha nhưng định dạng khác.

Thụy Điển — Personnummer

Personnummer là 10 hoặc 12 chữ số. Nó mã hóa ngày sinh và số thứ tự. Định dạng: YYYYMMDD-XXXX hoặc YYMMDD-XXXX.

Phần Lan — Henkilötunnus

HETU là 11 ký tự. Nó mã hóa ngày, ký tự phân cách, thứ tự và ký tự kiểm tra. Định dạng: DDMMYY-XXXC.

Những Gì Công Cụ Tiêu Chuẩn Bỏ Sót

Các công cụ Mỹ và Anh bao gồm các mẫu sau theo mặc định:

  • SSN Mỹ (XXX-XX-XXXX).
  • NINO Anh (XX 99 99 99 X).
  • Số hộ chiếu Mỹ.
  • Mẫu bằng lái xe Mỹ.
  • Số thẻ tín dụng lớn.

Các định danh quốc gia EU thường vắng mặt. Các công cụ xây dựng trên bộ nhận dạng mặc định của Presidio bỏ sót chúng. Không có các tiện ích mở rộng đặc thù EU, không có phủ EU.

Một Khoảng Trống Tuân Thủ Thực Tế

Một công ty lương Đức phục vụ 500 công ty khách hàng. Quy trình làm việc của nó xóa tên, email, IBAN và số điện thoại. Nhưng nó bỏ sót Steueridentifikationsnummern của Đức. Định dạng đó chưa bao giờ có trong thiết lập tiêu chuẩn.

Một cuộc kiểm toán DPA tìm thấy Steuer-ID không được xóa trong các tệp PDF phiếu lương. Công ty phải đối mặt với chi phí khắc phục cho các tài liệu trong quá khứ. Nó phải đối mặt với thực thi DPA theo Điều 83 GDPR. Nó phải đối mặt với trách nhiệm pháp lý theo hợp đồng với các khách hàng.

Khoảng trống không được phát hiện bởi công ty. Cơ quan quản lý phát hiện nó trước.

Xem hướng dẫn tuân thủ GDPR của chúng tôi để chạy kiểm tra phủ của riêng bạn.

Thứ Tự Ưu Tiên cho Phủ EU

Thêm các mẫu định danh theo thứ tự này nếu bạn hoạt động trên nhiều quốc gia EU.

Tầng 1 — Khối lượng cao nhất:

  1. Đức: Steueridentifikationsnummer.
  2. Pháp: Numéro fiscal.
  3. Ý: Codice Fiscale.
  4. Tây Ban Nha: NIF/NIE.
  5. Hà Lan: BSN.

Tầng 2 — Thị trường quan trọng nhưng nhỏ hơn:

  1. Ba Lan: PESEL.
  2. Bỉ: RN.
  3. Thụy Điển: Personnummer.
  4. Bồ Đào Nha: NIF.
  5. Áo: Sozialversicherungsnummer.

Tầng 3 — Các trường hợp sử dụng cụ thể:

17 quốc gia thành viên EU còn lại. Thêm dựa trên nơi nhóm của bạn xử lý dữ liệu.

Thêm Steueridentifikationsnummer

Steuer-ID của Đức là mẫu đầu tiên tốt nhất để thêm. Định dạng của nó rõ ràng và được ghi lại tốt.

Steuer-ID là 11 chữ số. Chữ số đầu tiên là 1–9. Không có ba chữ số giống nhau liên tiếp. Một thuật toán tùy chỉnh xác thực chữ số kiểm tra.

Mô tả ngôn ngữ thuần túy để tạo mẫu: "Số thuế Đức: 11 chữ số. Chữ số đầu tiên là 1–9. 10 chữ số còn lại có thể bao gồm số không."

Sau khi tạo mẫu, kiểm tra nó với các phiếu lương và giấy chứng nhận thuế Đức. Kiểm tra tỷ lệ phát hiện và tỷ lệ dương tính giả. Chỉ triển khai sau khi xác thực thành công.

Thêm mẫu vào preset ngôn ngữ Đức của bạn. Đối với bộ tài liệu đa ngôn ngữ, kết hợp với phát hiện ngôn ngữ. Điều này áp dụng đúng mẫu cho đúng tài liệu.

Một Preset hay Nhiều?

Lựa chọn 1 — Preset theo từng quốc gia:

Tạo một preset cho mỗi quốc gia. Định tuyến tài liệu theo nguồn gốc. Điều này cho tỷ lệ dương tính giả thấp hơn. Nó yêu cầu nhiều logic định tuyến hơn.

Lựa chọn 2 — Preset EU kết hợp:

Tạo một preset với tất cả các mẫu định danh EU được kích hoạt. Cái này đơn giản hơn để chạy. Nó có rủi ro dương tính giả cao hơn trên văn bản chung. Nó hoạt động tốt khi định danh được mong đợi trong toàn bộ tài liệu.

Đối với tài liệu lương: dùng Lựa chọn 1 với định tuyến theo nguồn gốc. Đối với bộ tài liệu hỗn hợp: dùng Lựa chọn 2 với điều chỉnh ngưỡng.

Xem tổng quan bảo mật và tuân thủ để biết cách cấu hình preset phù hợp với quy trình tuân thủ đầy đủ.

Đóng Khoảng Trống Trước Khi Kiểm Toán

GDPR áp dụng theo cùng cách ở mọi quốc gia thành viên EU. Các công cụ xây dựng tại Mỹ thường không làm vậy. Codice Fiscale, BSN và Steuer-ID mang rủi ro tương tự như SSN. Chúng xuất hiện thường xuyên như vậy trong các tài liệu được chia sẻ.

Các mẫu thực thể tùy chỉnh đóng khoảng trống phát hiện trong vài giờ. Thêm mẫu Steuer-ID. Kiểm tra nó với các phiếu lương Đức mẫu. Triển khai nó cho tất cả quy trình làm việc. Không cần chờ đợi nhà cung cấp công cụ. Không cần kiểm toán DPA để tìm khoảng trống.


anonym.legal cho phép bạn thêm các loại thực thể tùy chỉnh qua giao diện cấu hình preset. Các mẫu được xác thực với tài liệu mẫu của bạn trước khi triển khai.

Nguồn Tài Liệu

Sẵn sàng bảo vệ dữ liệu của bạn?

Bắt đầu ẩn danh PII với 285+ loại thực thể trên 48 ngôn ngữ.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.