ÚOOÚ a rodné číslo: Kódování pohlaví podle GDPR
Aktualizováno pro rok 2026
Český úřad pro ochranu dat je ÚOOÚ — celým názvem Úřad pro ochranu osobních údajů. V roce 2024 vydal 58 rozhodnutí. Jedno zjištění se opakuje napříč mnoha případy. Rodné číslo bylo zpracováváno bez detekce. Použitý nástroj PII byl postaven pro němčinu nebo angličtinu. Neměl žádnou logiku pro tento typ identifikátoru. ÚOOÚ je jasný: nástroje musejí detekovat rodné číslo s validací kontrolního součtu a správným zpracováním genderového posunu.
Rodné číslo: Zvláštní kategorie dat svou strukturou
Rodné číslo, zkráceně RČ, má formát RRMMDD/XXXX.
- RR — poslední dvě číslice roku narození.
- MM — měsíc narození. U žen se přičítá 50. Měsíc 01 se stává 51. Měsíc 12 se stává 62.
- DD — den narození.
- XXXX — krátká sekvence 3–4 číslic plus kontrolní hodnota (modulus 11).
Měsíční posun pro ženy z tohoto čísla činí ukazatel biologického pohlaví. Tento posun není náhodný. Systém evidence obyvatel jej využívá pro správní vyhledávání. Článek 9 GDPR se vztahuje na data odhalující osobnostní rysy. Pohlaví je jedním z nich. Stanovisko ÚOOÚ: každý dokument s rodným číslem nese data blízká zvláštní kategorii. Vztahuje se na ně silnější ochrana.
Jak funguje kontrolní hodnota: U 10místných čísel (vydaných po roce 1954) musí být celá 9místná základna dělitelná 11. U 9místných čísel (vydaných před rokem 1954) kontrolní hodnota neexistuje. Nástroje musejí podporovat obě varianty.
Co ÚOOÚ považuje za adekvátní detekci
Technické pokyny ÚOOÚ z roku 2024 pro nástroje PII stanovují tři požadavky.
Zpracování genderového posunu: Čísla s hodnotami měsíce 51–62 jsou platné identifikátory pro ženy. Nástroj, který tyto hodnoty považuje za neplatná data, přehlídne přibližně polovinu primárního ID dospělé ženské populace.
Varianty formátu: Narozeniny před rokem 1954 dávají 9místná čísla bez kontrolní hodnoty. Narozeniny po roce 1954 dávají 10místná čísla s jednou. Obě varianty musejí být podporovány.
Kontextové signály: V dokumentech v rodném jazyce se identifikátor vyskytuje v blízkosti označení jako „Rodné číslo:”, „RČ:” nebo „r.č.:”. NER s jazykovou podporou pomáhá tyto signály nacházet i v textu volné formy.
Problém německé mateřské společnosti
67 % firem v zemi nasazuje nástroje PII nakonfigurované pro němčinu nebo angličtinu. ÚOOÚ to zjistil průzkumem. Selhání v řetězci výrobních podniků je předvídatelné.
Německá mateřská společnost nasadí skenovací nástroj. Je nastaven pro německé identifikátory. HR data — smlouvy, zdravotní záznamy, mzdy — obsahují rodná čísla. Nástroj nemá žádnou logiku pro tento typ identifikátoru. Každé rodné číslo je přehlédnuto. Data o zdraví a mzdách zaměstnanců se přesouvají bez kontrol, které ÚOOÚ vyžaduje. Při auditu nebo narušení dat místní firma nemůže prokázat „vhodná technická opatření” podle článku 32 GDPR.
ÚOOÚ drží místního správce odpovědným. „Naše mateřská společnost nástroj vybrala” není platnou obhajobou. Pravidlo odpovědnosti GDPR to neumožňuje.
Kontrolní seznam souladu pro výrobní firmy
Tato opatření se vztahují na průmyslové firmy s nástroji německé mateřské společnosti.
- Detekce rodného čísla: Oba formáty — 9místný i 10místný. Genderový posun měsíce (50+). Kontrolní hodnota modulus-11 pro 10místné varianty.
- NER v rodném jazyce: spaCy
cs_core_newsnebo ekvivalentní model. Obecné nástroje vykazují u tohoto jazyka o 23 % nižší přesnost NER. Místní modely mezeru uzavírají. - Detekce čísla OP: Občanský průkaz má 9místné číslo. Vyskytuje se vedle rodného čísla v mnoha typech dokumentů.
- IČO a DIČ: Identifikační číslo osoby a daňové identifikační číslo se vyskytují ve smlouvách. Obě vyžadují pokrytí.
- Vícejazyčná pipeline: Smíšená prostředí obsahují dokumenty v rodném jazyce, němčině a angličtině. Jednojazyčná pipeline přehlíží mezjazykové výskyty.
Vymáhání ÚOOÚ je konzistentní. Firmy, které při auditu předloží technické důkazy, čelí výrazně nižším pokutám. Firmy, které je předložit nemohou, jsou vystaveny vyššímu riziku.
Pro širší pohled na to, jak národní ID zakládají expozici vůči GDPR, viz náš průvodce detekcí daňových ID v EU.
Pro podobný nordický identifikátor viz náš technický průvodce CPR Datatilsynet.