ÚOOÚ et Rodné Číslo : Encodage du Genre sous le RGPD
Mis à jour pour 2026
L'autorité de protection des données tchèque est l'ÚOOÚ. En toutes lettres : Úřad pro ochranu osobních údajů. Elle a rendu 58 décisions d'application en 2024. Un constat revient dans de nombreux cas. Le rodné číslo (numéro de naissance) a été traité sans détection. L'outil PII utilisé était conçu pour l'allemand ou l'anglais. Il n'avait aucune logique pour cet identifiant. L'ÚOOÚ est claire : les outils doivent détecter le rodné číslo avec validation de somme de contrôle et gestion correcte du décalage de genre.
Rodné Číslo : Données de Catégorie Spéciale par Structure
Le rodné číslo, ou RČ, utilise le format RRMMDD/XXXX.
- RR — deux derniers chiffres de l'année de naissance.
- MM — mois de naissance. Pour les femmes, 50 est ajouté. Le mois 01 devient 51. Le mois 12 devient 62.
- JJ — jour de naissance.
- XXXX — une courte séquence de 3 à 4 chiffres plus une valeur de contrôle (modulo 11).
Le décalage du mois pour les femmes fait de ce numéro un indicateur structurel du sexe biologique. Ce décalage n'est pas fortuit. Le système d'état civil l'utilise pour les recherches administratives. L'article 9 du RGPD couvre les données révélant des caractéristiques personnelles. Le sexe en fait partie. Selon l'ÚOOÚ : tout document contenant un rodné číslo porte des données de catégorie adjacente spéciale. Une protection renforcée s'applique.
Fonctionnement de la valeur de contrôle : Pour les numéros à 10 caractères (émis après 1954), la base à 9 caractères doit être divisible par 11. Pour les numéros à 9 caractères (avant 1954), aucune valeur de contrôle n'existe. Les outils doivent gérer les deux.
Ce que l'ÚOOÚ Appelle une Détection Adéquate
Les directives techniques 2024 de l'ÚOOÚ pour les outils PII fixent trois exigences.
Gestion du décalage de genre : Les numéros avec des valeurs de mois 51–62 sont des identifiants valides pour les femmes. Un outil qui les traite comme des dates invalides manque environ la moitié de la population féminine adulte.
Variantes de format : Les naissances avant 1954 produisent des numéros à 9 caractères sans valeur de contrôle. Les naissances après 1954 produisent des numéros à 10 caractères avec une. Les deux doivent être pris en charge.
Signaux contextuels : Dans les documents en langue maternelle, l'identifiant apparaît près de libellés tels que "Rodné číslo:", "RČ:" ou "r.č.:". Un NER sensible à la langue aide à trouver ces signaux même dans des textes non structurés.
Le Problème de la Société Mère Allemande
67 % des entreprises du pays déploient des outils PII configurés pour l'allemand ou l'anglais. L'ÚOOÚ l'a documenté dans une enquête. La chaîne de défaillance dans la fabrication est prévisible.
Une société mère allemande déploie un outil de scan. Il est configuré pour les identifiants allemands. Les données RH — contrats, dossiers de santé, paie — contiennent des numéros de naissance. L'outil n'a aucune logique pour ce type d'identifiant. Chaque numéro de naissance est manqué. Les données de santé et de salaire des employés circulent sans les contrôles requis par l'ÚOOÚ. En cas d'audit ou de violation, la filiale locale ne peut pas démontrer des "mesures techniques appropriées" au titre de l'article 32 du RGPD.
L'ÚOOÚ tient le responsable du traitement local pour accountable. "Notre société mère a choisi cet outil" n'est pas une défense valide. La règle de responsabilité du RGPD ne le permet pas.
Liste de Contrôle de Conformité pour les Industriels
Ces contrôles s'appliquent aux entreprises industrielles utilisant les outils de leur société mère allemande.
- Détection du numéro de naissance : Formats à 9 et 10 caractères. Gestion du décalage du mois de genre (50+). Valeur de contrôle modulo 11 pour les variantes à 10 caractères.
- NER en langue maternelle : spaCy
cs_core_newsou un modèle équivalent. Les outils génériques affichent 23 % de précision NER inférieure pour cette langue. Les modèles spécifiques à la langue comblent l'écart. - Détection du Číslo OP : L'občanský průkaz (carte d'identité nationale) est un numéro à 9 caractères. Il apparaît aux côtés du numéro de naissance dans de nombreux types de documents.
- IČO et DIČ : Les numéros d'identification d'entreprise et fiscaux figurent dans les contrats. Les deux nécessitent une couverture.
- Pipeline multilingue : Les environnements mixtes contiennent des documents en langue locale, en allemand et en anglais. Un pipeline monolingue manque les co-occurrences interlinguistiques.
L'application par l'ÚOOÚ est cohérente. Les entreprises qui présentent des preuves techniques lors d'un audit font face à des amendes bien moins élevées. Celles qui ne le peuvent pas ont une exposition plus grande.
Pour un aperçu plus large de la façon dont les identifiants nationaux créent des risques RGPD, consultez notre guide de détection des identifiants fiscaux nationaux de l'UE.
Pour un identifiant nordique similaire, consultez notre guide technique CPR de Datatilsynet.