ÚOOÚ và Rodné Číslo: Mã Hóa Giới Tính Theo GDPR
Cập nhật cho năm 2026
Cơ quan dữ liệu Séc là ÚOOÚ. Đầy đủ là: Úřad pro ochranu osobních údajů. Cơ quan đã ban hành 58 phán quyết trong năm 2024. Một phát hiện xuất hiện trong nhiều vụ. Rodné číslo (số khai sinh) đã được xử lý mà không có phát hiện. Công cụ PII được sử dụng được xây dựng cho tiếng Đức hoặc tiếng Anh. Nó không có logic cho loại định danh này. ÚOOÚ rõ ràng: các công cụ phải phát hiện rodné číslo với xác thực checksum và xử lý dịch chuyển giới tính đúng đắn.
Rodné Číslo: Dữ Liệu Danh Mục Đặc Biệt Theo Cấu Trúc
Rodné číslo, hay RČ, sử dụng định dạng RRMMDD/XXXX.
- RR — hai chữ số cuối của năm sinh.
- MM — tháng sinh. Đối với phụ nữ, 50 được cộng vào. Tháng 01 thành 51. Tháng 12 thành 62.
- DD — ngày sinh.
- XXXX — một chuỗi ngắn gồm 3–4 chữ số cộng với giá trị kiểm tra (modulus 11).
Dịch chuyển tháng của phụ nữ làm cho số này trở thành dấu hiệu của giới tính sinh học. Dịch chuyển đó không phải ngẫu nhiên. Hệ thống đăng ký dân sự sử dụng nó để tra cứu hành chính. Điều 9 GDPR bao phủ dữ liệu tiết lộ đặc điểm cá nhân. Giới tính là một trong số đó. Quan điểm của ÚOOÚ: bất kỳ tài liệu nào có rodné číslo đều mang dữ liệu liên quan đến danh mục đặc biệt. Áp dụng bảo vệ mạnh hơn.
Cách giá trị kiểm tra hoạt động: Đối với số 10 ký tự (cấp sau năm 1954), toàn bộ cơ sở 9 ký tự phải chia hết cho 11. Đối với số 9 ký tự (cấp trước năm 1954), không có giá trị kiểm tra. Các công cụ phải xử lý cả hai.
ÚOOÚ Gọi Phát Hiện Đầy Đủ Là Gì
Hướng dẫn kỹ thuật 2024 của ÚOOÚ cho công cụ PII đặt ra ba yêu cầu.
Xử lý dịch chuyển giới tính: Các số có giá trị tháng 51–62 là định danh hợp lệ cho phụ nữ. Một công cụ coi những giá trị đó là ngày không hợp lệ sẽ bỏ sót khoảng một nửa ID chính của dân số nữ trưởng thành.
Các biến thể định dạng: Những người sinh trước năm 1954 có số 9 ký tự không có giá trị kiểm tra. Những người sinh sau năm 1954 có số 10 ký tự với một giá trị kiểm tra. Cả hai phải được hỗ trợ.
Tín hiệu ngữ cảnh: Trong tài liệu ngôn ngữ bản địa, định danh xuất hiện gần nhãn như "Rodné číslo:", "RČ:" hay "r.č.:". NER nhận biết ngôn ngữ giúp tìm những tín hiệu này ngay cả trong văn bản tự do.
Vấn Đề Công Ty Mẹ Đức
67% công ty trong nước triển khai công cụ PII được cấu hình theo tiếng Đức hay tiếng Anh. ÚOOÚ phát hiện điều này trong một cuộc khảo sát. Chuỗi lỗi trong lĩnh vực sản xuất có thể đoán trước được.
Một công ty mẹ Đức triển khai công cụ quét. Nó được thiết lập cho định danh Đức. Dữ liệu HR — hợp đồng, hồ sơ y tế, bảng lương — chứa số khai sinh. Công cụ không có logic cho loại định danh này. Mọi số khai sinh đều bị bỏ sót. Dữ liệu sức khỏe và lương thưởng của nhân viên di chuyển mà không có biện pháp kiểm soát mà ÚOOÚ yêu cầu. Trong một cuộc kiểm toán hay vi phạm, công ty địa phương không thể chứng minh "các biện pháp kỹ thuật phù hợp" theo Điều 32 GDPR.
ÚOOÚ giữ người kiểm soát địa phương chịu trách nhiệm. "Công ty mẹ đã chọn công cụ" không phải là biện hộ hợp lệ. Quy tắc trách nhiệm giải trình của GDPR không cho phép điều đó.
Danh Sách Kiểm Tra Tuân Thủ cho Công Ty Sản Xuất
Các biện pháp kiểm soát này áp dụng cho các công ty công nghiệp có công cụ của công ty mẹ Đức.
- Phát hiện số khai sinh: Cả định dạng 9 ký tự và 10 ký tự. Xử lý tháng dịch chuyển giới tính (50+). Giá trị kiểm tra modulus-11 cho biến thể 10 ký tự.
- NER ngôn ngữ bản địa: spaCy
cs_core_newshoặc mô hình tương đương. Các công cụ thông thường cho thấy độ chính xác NER thấp hơn 23% cho ngôn ngữ này. Các mô hình địa phương thu hẹp khoảng cách. - Phát hiện Číslo OP: Thẻ công dân (thẻ ID quốc gia) là số 9 ký tự. Nó xuất hiện cùng với số khai sinh trong nhiều loại tài liệu.
- IČO và DIČ: Số ID doanh nghiệp và mã số thuế xuất hiện trong hợp đồng. Cả hai cần được bao phủ.
- Pipeline đa ngôn ngữ: Môi trường hỗn hợp có tài liệu bằng ngôn ngữ địa phương, tiếng Đức và tiếng Anh. Một pipeline đơn ngôn ngữ bỏ sót sự cùng xuất hiện liên ngôn ngữ.
Thực thi của ÚOOÚ nhất quán. Các công ty đưa ra bằng chứng kỹ thuật trong cuộc kiểm toán phải đối mặt khoản phạt thấp hơn nhiều. Các công ty không thể đưa ra bằng chứng phải đối mặt rủi ro cao hơn.
Để có góc nhìn rộng hơn về cách ID quốc gia tạo ra rủi ro GDPR, xem hướng dẫn phát hiện mã số thuế quốc gia EU của chúng tôi.
Để biết một định danh Bắc Âu tương tự, xem hướng dẫn kỹ thuật CPR Datatilsynet của chúng tôi.