By · Last updated 2026-06-05

Quay lại BlogGDPR & Tuân Thủ

Rodné Číslo Séc: Mã Hóa Giới Tính và GDPR

Rodné číslo Séc mã hóa giới tính qua mã hóa tháng dịch chuyển 50 — khiến nó trở thành dữ liệu danh mục đặc biệt theo Điều 9 GDPR. 67% công ty Séc sử dụng công cụ của Đức.

June 5, 20267 phút đọc
Czech ÚOOÚrodné číslo detectionCzech GDPR compliancemanufacturing data protectionCentral Europe

ÚOOÚ và Rodné Číslo: Mã Hóa Giới Tính Theo GDPR

Cập nhật cho năm 2026

Cơ quan dữ liệu Séc là ÚOOÚ. Đầy đủ là: Úřad pro ochranu osobních údajů. Cơ quan đã ban hành 58 phán quyết trong năm 2024. Một phát hiện xuất hiện trong nhiều vụ. Rodné číslo (số khai sinh) đã được xử lý mà không có phát hiện. Công cụ PII được sử dụng được xây dựng cho tiếng Đức hoặc tiếng Anh. Nó không có logic cho loại định danh này. ÚOOÚ rõ ràng: các công cụ phải phát hiện rodné číslo với xác thực checksum và xử lý dịch chuyển giới tính đúng đắn.

Rodné Číslo: Dữ Liệu Danh Mục Đặc Biệt Theo Cấu Trúc

Rodné číslo, hay RČ, sử dụng định dạng RRMMDD/XXXX.

  • RR — hai chữ số cuối của năm sinh.
  • MM — tháng sinh. Đối với phụ nữ, 50 được cộng vào. Tháng 01 thành 51. Tháng 12 thành 62.
  • DD — ngày sinh.
  • XXXX — một chuỗi ngắn gồm 3–4 chữ số cộng với giá trị kiểm tra (modulus 11).

Dịch chuyển tháng của phụ nữ làm cho số này trở thành dấu hiệu của giới tính sinh học. Dịch chuyển đó không phải ngẫu nhiên. Hệ thống đăng ký dân sự sử dụng nó để tra cứu hành chính. Điều 9 GDPR bao phủ dữ liệu tiết lộ đặc điểm cá nhân. Giới tính là một trong số đó. Quan điểm của ÚOOÚ: bất kỳ tài liệu nào có rodné číslo đều mang dữ liệu liên quan đến danh mục đặc biệt. Áp dụng bảo vệ mạnh hơn.

Cách giá trị kiểm tra hoạt động: Đối với số 10 ký tự (cấp sau năm 1954), toàn bộ cơ sở 9 ký tự phải chia hết cho 11. Đối với số 9 ký tự (cấp trước năm 1954), không có giá trị kiểm tra. Các công cụ phải xử lý cả hai.

ÚOOÚ Gọi Phát Hiện Đầy Đủ Là Gì

Hướng dẫn kỹ thuật 2024 của ÚOOÚ cho công cụ PII đặt ra ba yêu cầu.

Xử lý dịch chuyển giới tính: Các số có giá trị tháng 51–62 là định danh hợp lệ cho phụ nữ. Một công cụ coi những giá trị đó là ngày không hợp lệ sẽ bỏ sót khoảng một nửa ID chính của dân số nữ trưởng thành.

Các biến thể định dạng: Những người sinh trước năm 1954 có số 9 ký tự không có giá trị kiểm tra. Những người sinh sau năm 1954 có số 10 ký tự với một giá trị kiểm tra. Cả hai phải được hỗ trợ.

Tín hiệu ngữ cảnh: Trong tài liệu ngôn ngữ bản địa, định danh xuất hiện gần nhãn như "Rodné číslo:", "RČ:" hay "r.č.:". NER nhận biết ngôn ngữ giúp tìm những tín hiệu này ngay cả trong văn bản tự do.

Vấn Đề Công Ty Mẹ Đức

67% công ty trong nước triển khai công cụ PII được cấu hình theo tiếng Đức hay tiếng Anh. ÚOOÚ phát hiện điều này trong một cuộc khảo sát. Chuỗi lỗi trong lĩnh vực sản xuất có thể đoán trước được.

Một công ty mẹ Đức triển khai công cụ quét. Nó được thiết lập cho định danh Đức. Dữ liệu HR — hợp đồng, hồ sơ y tế, bảng lương — chứa số khai sinh. Công cụ không có logic cho loại định danh này. Mọi số khai sinh đều bị bỏ sót. Dữ liệu sức khỏe và lương thưởng của nhân viên di chuyển mà không có biện pháp kiểm soát mà ÚOOÚ yêu cầu. Trong một cuộc kiểm toán hay vi phạm, công ty địa phương không thể chứng minh "các biện pháp kỹ thuật phù hợp" theo Điều 32 GDPR.

ÚOOÚ giữ người kiểm soát địa phương chịu trách nhiệm. "Công ty mẹ đã chọn công cụ" không phải là biện hộ hợp lệ. Quy tắc trách nhiệm giải trình của GDPR không cho phép điều đó.

Danh Sách Kiểm Tra Tuân Thủ cho Công Ty Sản Xuất

Các biện pháp kiểm soát này áp dụng cho các công ty công nghiệp có công cụ của công ty mẹ Đức.

  • Phát hiện số khai sinh: Cả định dạng 9 ký tự và 10 ký tự. Xử lý tháng dịch chuyển giới tính (50+). Giá trị kiểm tra modulus-11 cho biến thể 10 ký tự.
  • NER ngôn ngữ bản địa: spaCy cs_core_news hoặc mô hình tương đương. Các công cụ thông thường cho thấy độ chính xác NER thấp hơn 23% cho ngôn ngữ này. Các mô hình địa phương thu hẹp khoảng cách.
  • Phát hiện Číslo OP: Thẻ công dân (thẻ ID quốc gia) là số 9 ký tự. Nó xuất hiện cùng với số khai sinh trong nhiều loại tài liệu.
  • IČO và DIČ: Số ID doanh nghiệp và mã số thuế xuất hiện trong hợp đồng. Cả hai cần được bao phủ.
  • Pipeline đa ngôn ngữ: Môi trường hỗn hợp có tài liệu bằng ngôn ngữ địa phương, tiếng Đức và tiếng Anh. Một pipeline đơn ngôn ngữ bỏ sót sự cùng xuất hiện liên ngôn ngữ.

Thực thi của ÚOOÚ nhất quán. Các công ty đưa ra bằng chứng kỹ thuật trong cuộc kiểm toán phải đối mặt khoản phạt thấp hơn nhiều. Các công ty không thể đưa ra bằng chứng phải đối mặt rủi ro cao hơn.

Để có góc nhìn rộng hơn về cách ID quốc gia tạo ra rủi ro GDPR, xem hướng dẫn phát hiện mã số thuế quốc gia EU của chúng tôi.

Để biết một định danh Bắc Âu tương tự, xem hướng dẫn kỹ thuật CPR Datatilsynet của chúng tôi.

Nguồn

Sẵn sàng bảo vệ dữ liệu của bạn?

Bắt đầu ẩn danh PII với 285+ loại thực thể trên 48 ngôn ngữ.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.