By · Last updated 2026-06-05

Zpět na blogGDPR a shoda

České rodné číslo: Kódování pohlaví a GDPR

České rodné číslo kóduje pohlaví prostřednictvím měsíčního posunu o 50 — čímž se stává údajem zvláštní kategorie podle článku 9 GDPR. 67 % českých firem používá německé nástroje.

June 5, 20267 min čtení
Czech ÚOOÚrodné číslo detectionCzech GDPR compliancemanufacturing data protectionCentral Europe

ÚOOÚ a rodné číslo: Kódování pohlaví podle GDPR

Aktualizováno pro rok 2026

Český úřad pro ochranu dat je ÚOOÚ — celým názvem Úřad pro ochranu osobních údajů. V roce 2024 vydal 58 rozhodnutí. Jedno zjištění se opakuje napříč mnoha případy. Rodné číslo bylo zpracováváno bez detekce. Použitý nástroj PII byl postaven pro němčinu nebo angličtinu. Neměl žádnou logiku pro tento typ identifikátoru. ÚOOÚ je jasný: nástroje musejí detekovat rodné číslo s validací kontrolního součtu a správným zpracováním genderového posunu.

Rodné číslo: Zvláštní kategorie dat svou strukturou

Rodné číslo, zkráceně RČ, má formát RRMMDD/XXXX.

  • RR — poslední dvě číslice roku narození.
  • MM — měsíc narození. U žen se přičítá 50. Měsíc 01 se stává 51. Měsíc 12 se stává 62.
  • DD — den narození.
  • XXXX — krátká sekvence 3–4 číslic plus kontrolní hodnota (modulus 11).

Měsíční posun pro ženy z tohoto čísla činí ukazatel biologického pohlaví. Tento posun není náhodný. Systém evidence obyvatel jej využívá pro správní vyhledávání. Článek 9 GDPR se vztahuje na data odhalující osobnostní rysy. Pohlaví je jedním z nich. Stanovisko ÚOOÚ: každý dokument s rodným číslem nese data blízká zvláštní kategorii. Vztahuje se na ně silnější ochrana.

Jak funguje kontrolní hodnota: U 10místných čísel (vydaných po roce 1954) musí být celá 9místná základna dělitelná 11. U 9místných čísel (vydaných před rokem 1954) kontrolní hodnota neexistuje. Nástroje musejí podporovat obě varianty.

Co ÚOOÚ považuje za adekvátní detekci

Technické pokyny ÚOOÚ z roku 2024 pro nástroje PII stanovují tři požadavky.

Zpracování genderového posunu: Čísla s hodnotami měsíce 51–62 jsou platné identifikátory pro ženy. Nástroj, který tyto hodnoty považuje za neplatná data, přehlídne přibližně polovinu primárního ID dospělé ženské populace.

Varianty formátu: Narozeniny před rokem 1954 dávají 9místná čísla bez kontrolní hodnoty. Narozeniny po roce 1954 dávají 10místná čísla s jednou. Obě varianty musejí být podporovány.

Kontextové signály: V dokumentech v rodném jazyce se identifikátor vyskytuje v blízkosti označení jako „Rodné číslo:”, „RČ:” nebo „r.č.:”. NER s jazykovou podporou pomáhá tyto signály nacházet i v textu volné formy.

Problém německé mateřské společnosti

67 % firem v zemi nasazuje nástroje PII nakonfigurované pro němčinu nebo angličtinu. ÚOOÚ to zjistil průzkumem. Selhání v řetězci výrobních podniků je předvídatelné.

Německá mateřská společnost nasadí skenovací nástroj. Je nastaven pro německé identifikátory. HR data — smlouvy, zdravotní záznamy, mzdy — obsahují rodná čísla. Nástroj nemá žádnou logiku pro tento typ identifikátoru. Každé rodné číslo je přehlédnuto. Data o zdraví a mzdách zaměstnanců se přesouvají bez kontrol, které ÚOOÚ vyžaduje. Při auditu nebo narušení dat místní firma nemůže prokázat „vhodná technická opatření” podle článku 32 GDPR.

ÚOOÚ drží místního správce odpovědným. „Naše mateřská společnost nástroj vybrala” není platnou obhajobou. Pravidlo odpovědnosti GDPR to neumožňuje.

Kontrolní seznam souladu pro výrobní firmy

Tato opatření se vztahují na průmyslové firmy s nástroji německé mateřské společnosti.

  • Detekce rodného čísla: Oba formáty — 9místný i 10místný. Genderový posun měsíce (50+). Kontrolní hodnota modulus-11 pro 10místné varianty.
  • NER v rodném jazyce: spaCy cs_core_news nebo ekvivalentní model. Obecné nástroje vykazují u tohoto jazyka o 23 % nižší přesnost NER. Místní modely mezeru uzavírají.
  • Detekce čísla OP: Občanský průkaz má 9místné číslo. Vyskytuje se vedle rodného čísla v mnoha typech dokumentů.
  • IČO a DIČ: Identifikační číslo osoby a daňové identifikační číslo se vyskytují ve smlouvách. Obě vyžadují pokrytí.
  • Vícejazyčná pipeline: Smíšená prostředí obsahují dokumenty v rodném jazyce, němčině a angličtině. Jednojazyčná pipeline přehlíží mezjazykové výskyty.

Vymáhání ÚOOÚ je konzistentní. Firmy, které při auditu předloží technické důkazy, čelí výrazně nižším pokutám. Firmy, které je předložit nemohou, jsou vystaveny vyššímu riziku.

Pro širší pohled na to, jak národní ID zakládají expozici vůči GDPR, viz náš průvodce detekcí daňových ID v EU.

Pro podobný nordický identifikátor viz náš technický průvodce CPR Datatilsynet.

Zdroje

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.