ÚOOÚ și Rodné Číslo: Codificarea Genului sub GDPR
Actualizat pentru 2026
Autoritatea cehă de protecție a datelor este ÚOOÚ. Denumirea completă: Úřad pro ochranu osobních údajů. A emis 58 de hotărâri în 2024. O constatare apare în mai multe cazuri. Rodné číslo (numărul de naștere) a fost procesat fără detectare. Instrumentul PII utilizat a fost construit pentru germană sau engleză, neavând nicio logică pentru acest tip de identificator. ÚOOÚ este clar: instrumentele trebuie să detecteze rodné číslo cu validarea sumei de control și gestionarea corectă a offset-ului de gen.
Rodné Číslo: Date din Categorie Specială prin Structură
Rodné číslo, sau RČ, folosește formatul AALLZZ/XXXX.
- AA — ultimele două cifre ale anului de naștere.
- LL — luna nașterii. Pentru femei, se adaugă 50. Luna 01 devine 51. Luna 12 devine 62.
- ZZ — ziua nașterii.
- XXXX — o secvență scurtă de 3–4 cifre plus o valoare de control (modulus 11).
Offset-ul lunii pentru femei face din acest număr un marker al sexului biologic. Acel offset nu este incidental. Sistemul de înregistrare civilă îl folosește pentru căutări administrative. Articolul 9 din GDPR acoperă datele care dezvăluie trăsături personale. Sexul este una dintre ele. Poziția ÚOOÚ: orice document cu un rodné číslo conține date cu caracter adiacent categoriei speciale. Se aplică o protecție mai puternică.
Cum funcționează valoarea de control: Pentru numerele de 10 caractere (emise după 1954), baza de 9 caractere completă trebuie să fie divizibilă cu 11. Pentru numerele de 9 caractere (emise înainte de 1954), nu există valoare de control. Instrumentele trebuie să le gestioneze pe amândouă.
Ce Consideră ÚOOÚ Detectare Adecvată
Ghidul tehnic ÚOOÚ din 2024 pentru instrumentele PII stabilește trei cerințe.
Gestionarea offset-ului de gen: Numerele cu valori ale lunii 51–62 sunt identificatori valabili pentru femei. Un instrument care tratează aceste valori ca date invalide ratează aproximativ jumătate din ID-ul principal al populației adulte feminine.
Variante de format: Nașterile înainte de 1954 dau numere de 9 caractere fără valoare de control. Nașterile după 1954 dau numere de 10 caractere cu una. Ambele trebuie să fie suportate.
Semnale de context: În documentele în limbă nativă, identificatorul apare lângă etichete precum Rodné číslo:, RČ: sau r.č.:. NER-ul conștient de limbă ajută la găsirea acestor semnale chiar și în text liber.
Problema Companiei-Mamă Germane
67% din firmele din țară utilizează instrumente PII configurate pentru germană sau engleză. ÚOOÚ a constatat acest lucru într-un sondaj. Lanțul de eșecuri în producție este previzibil.
O companie-mamă germană implementează un instrument de scanare configurat pentru identificatoare germane. Datele HR — contracte, dosare medicale, state de plată — conțin numere de naștere. Instrumentul nu are logică pentru acest tip de identificator. Fiecare număr de naștere este ratat. Datele medicale și salariale ale angajaților circulă fără controalele impuse de ÚOOÚ. Într-un audit sau o breșă, firma locală nu poate demonstra măsuri tehnice adecvate conform articolului 32 din GDPR.
ÚOOÚ consideră responsabil controlorul local. Răspunsul că firma-mamă a ales instrumentul nu este o apărare valabilă. Regula de responsabilitate a GDPR nu o permite.
Listă de Verificare Conformitate pentru Firme de Producție
Aceste controale se aplică firmelor industriale cu instrumente ale companiei-mamă germane.
- Detectarea numărului de naștere: Atât formatul de 9 caractere, cât și cel de 10 caractere. Gestionarea lunii cu offset de gen (50+). Valoarea de control modulus-11 pentru variantele de 10 caractere.
- NER în limbă nativă: spaCy
cs_core_newssau un model echivalent. Instrumentele generice au o precizie NER cu 23% mai mică pentru această limbă. Modelele locale închid decalajul. - Detectarea číslo OP: Občanský průkaz (cartea de identitate națională) este un număr de 9 caractere. Apare alături de numărul de naștere în multe tipuri de documente.
- IČO și DIČ: ID-ul de afaceri și numerele fiscale apar în contracte. Ambele necesită acoperire.
- Conductă multilingvă: Mediile mixte au documente în limba locală, germană și engleză. O conductă într-o singură limbă ratează co-ocurența cross-lingvistică.
Aplicarea ÚOOÚ este consecventă. Firmele care prezintă dovezi tehnice într-un audit se confruntă cu amenzi mult mai mici. Firmele care nu le pot prezenta au o expunere mai mare.
Pentru o perspectivă mai largă asupra expunerii GDPR generate de ID-urile naționale, consultați ghidul nostru de detectare a CNP-urilor fiscale naționale din UE.
Pentru un identificator nordic similar, consultați ghidul tehnic CPR Datatilsynet.