By · Last updated 2026-06-05

Retour au blogGDPR & Conformité

ÚOOÚ République tchèque : Codage du genre du Rodné...

Le rodné číslo tchèque encode le genre via un codage de mois décalé de 50 — en faisant des données de catégorie spéciale selon l'article 9 du GDPR.

June 5, 20267 min de lecture
Czech ÚOOÚrodné číslo detectionCzech GDPR compliancemanufacturing data protectionCentral Europe

ÚOOÚ et Rodné Číslo : Encodage du Genre sous le RGPD

Mis à jour pour 2026

L'autorité de protection des données tchèque est l'ÚOOÚ. En toutes lettres : Úřad pro ochranu osobních údajů. Elle a rendu 58 décisions d'application en 2024. Un constat revient dans de nombreux cas. Le rodné číslo (numéro de naissance) a été traité sans détection. L'outil PII utilisé était conçu pour l'allemand ou l'anglais. Il n'avait aucune logique pour cet identifiant. L'ÚOOÚ est claire : les outils doivent détecter le rodné číslo avec validation de somme de contrôle et gestion correcte du décalage de genre.

Rodné Číslo : Données de Catégorie Spéciale par Structure

Le rodné číslo, ou RČ, utilise le format RRMMDD/XXXX.

  • RR — deux derniers chiffres de l'année de naissance.
  • MM — mois de naissance. Pour les femmes, 50 est ajouté. Le mois 01 devient 51. Le mois 12 devient 62.
  • JJ — jour de naissance.
  • XXXX — une courte séquence de 3 à 4 chiffres plus une valeur de contrôle (modulo 11).

Le décalage du mois pour les femmes fait de ce numéro un indicateur structurel du sexe biologique. Ce décalage n'est pas fortuit. Le système d'état civil l'utilise pour les recherches administratives. L'article 9 du RGPD couvre les données révélant des caractéristiques personnelles. Le sexe en fait partie. Selon l'ÚOOÚ : tout document contenant un rodné číslo porte des données de catégorie adjacente spéciale. Une protection renforcée s'applique.

Fonctionnement de la valeur de contrôle : Pour les numéros à 10 caractères (émis après 1954), la base à 9 caractères doit être divisible par 11. Pour les numéros à 9 caractères (avant 1954), aucune valeur de contrôle n'existe. Les outils doivent gérer les deux.

Ce que l'ÚOOÚ Appelle une Détection Adéquate

Les directives techniques 2024 de l'ÚOOÚ pour les outils PII fixent trois exigences.

Gestion du décalage de genre : Les numéros avec des valeurs de mois 51–62 sont des identifiants valides pour les femmes. Un outil qui les traite comme des dates invalides manque environ la moitié de la population féminine adulte.

Variantes de format : Les naissances avant 1954 produisent des numéros à 9 caractères sans valeur de contrôle. Les naissances après 1954 produisent des numéros à 10 caractères avec une. Les deux doivent être pris en charge.

Signaux contextuels : Dans les documents en langue maternelle, l'identifiant apparaît près de libellés tels que "Rodné číslo:", "RČ:" ou "r.č.:". Un NER sensible à la langue aide à trouver ces signaux même dans des textes non structurés.

Le Problème de la Société Mère Allemande

67 % des entreprises du pays déploient des outils PII configurés pour l'allemand ou l'anglais. L'ÚOOÚ l'a documenté dans une enquête. La chaîne de défaillance dans la fabrication est prévisible.

Une société mère allemande déploie un outil de scan. Il est configuré pour les identifiants allemands. Les données RH — contrats, dossiers de santé, paie — contiennent des numéros de naissance. L'outil n'a aucune logique pour ce type d'identifiant. Chaque numéro de naissance est manqué. Les données de santé et de salaire des employés circulent sans les contrôles requis par l'ÚOOÚ. En cas d'audit ou de violation, la filiale locale ne peut pas démontrer des "mesures techniques appropriées" au titre de l'article 32 du RGPD.

L'ÚOOÚ tient le responsable du traitement local pour accountable. "Notre société mère a choisi cet outil" n'est pas une défense valide. La règle de responsabilité du RGPD ne le permet pas.

Liste de Contrôle de Conformité pour les Industriels

Ces contrôles s'appliquent aux entreprises industrielles utilisant les outils de leur société mère allemande.

  • Détection du numéro de naissance : Formats à 9 et 10 caractères. Gestion du décalage du mois de genre (50+). Valeur de contrôle modulo 11 pour les variantes à 10 caractères.
  • NER en langue maternelle : spaCy cs_core_news ou un modèle équivalent. Les outils génériques affichent 23 % de précision NER inférieure pour cette langue. Les modèles spécifiques à la langue comblent l'écart.
  • Détection du Číslo OP : L'občanský průkaz (carte d'identité nationale) est un numéro à 9 caractères. Il apparaît aux côtés du numéro de naissance dans de nombreux types de documents.
  • IČO et DIČ : Les numéros d'identification d'entreprise et fiscaux figurent dans les contrats. Les deux nécessitent une couverture.
  • Pipeline multilingue : Les environnements mixtes contiennent des documents en langue locale, en allemand et en anglais. Un pipeline monolingue manque les co-occurrences interlinguistiques.

L'application par l'ÚOOÚ est cohérente. Les entreprises qui présentent des preuves techniques lors d'un audit font face à des amendes bien moins élevées. Celles qui ne le peuvent pas ont une exposition plus grande.

Pour un aperçu plus large de la façon dont les identifiants nationaux créent des risques RGPD, consultez notre guide de détection des identifiants fiscaux nationaux de l'UE.

Pour un identifiant nordique similaire, consultez notre guide technique CPR de Datatilsynet.

Sources

Prêt à protéger vos données ?

Commencez à anonymiser les PII avec plus de 285 types d'entités dans 48 langues.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.