ÚOOÚ og rodné číslo: Kønsindkodning under GDPR
Opdateret til 2026
Tjekkiets databeskyttelsesmyndighed hedder ÚOOÚ — fuldt navn: Úřad pro ochranu osobních údajů. Den traf 58 afgørelser i 2024. Et fund går igen på tværs af mange sager: rodné číslo (fødselsnummer) blev behandlet uden detektion. Det anvendte PII-værktøj var bygget til tysk eller engelsk og havde ingen logik for denne identifikatortype. ÚOOÚ er tydelig: Værktøjer skal detektere rodné číslo med kontrolsumvalidering og korrekt køns-offset-håndtering.
Rodné číslo: Særkategori-data i kraft af strukturen
Rodné číslo (RČ) bruger formatet RRMMDD/XXXX.
- RR — de to sidste cifre i fødselsåret.
- MM — fødselsmåned. For kvinder lægges 50 til. Måned 01 bliver 51. Måned 12 bliver 62.
- DD — fødselsdato.
- XXXX — en kort sekvens på 3–4 cifre plus en kontrolværdi (modulus 11).
Kvindens måneds-offset gør dette nummer til en markør for biologisk køn. Offset'et er ikke tilfældigt. Folkeregistreringssystemet bruger det til administrative opslag. GDPR artikel 9 dækker data, der afslører personlige karakteristika. Køn er et af dem. ÚOOÚ's syn: ethvert dokument med et rodné číslo bærer data nær særkategoristatus. Stærkere beskyttelse gælder.
Sådan fungerer kontrolværdien: For 10-tegns numre (udstedt efter 1954) skal de fulde 9 grundcifre kunne divideres jævnt med 11. For 9-tegns numre (udstedt før 1954) eksisterer ingen kontrolværdi. Værktøjer skal understøtte begge.
Hvad ÚOOÚ anser for tilstrækkelig detektion
ÚOOÚs tekniske vejledning til PII-værktøjer fra 2024 stiller tre krav.
Køns-offset-håndtering: Numre med månedværdier 51–62 er gyldige identifikatorer for kvinder. Et værktøj, der behandler disse som ugyldige datoer, overser den primære ID for ca. halvdelen af den voksne kvindelige befolkning.
Formatvarianter: Fødsler før 1954 giver 9-tegns numre uden kontrolværdi. Fødsler efter 1954 giver 10-tegns numre med én. Begge skal understøttes.
Kontekstsignaler: I modersmålsdokumenter optræder identifikatoren nær mærker som "Rodné číslo:", "RČ:" eller "r.č.:". Sprogbevidst NER hjælper med at finde disse signaler selv i friteksst.
Problemet med tyske moderselskaber
67% af virksomhederne i landet anvender tyske eller engelskkonfigurerede PII-værktøjer, ifølge UÚOUs undersøgelse. Fejlkæden i fremstillingssektoren er forudsigelig.
Et tysk moderselskab implementerer et scanningsværktøj konfigureret til tyske identifikatorer. HR-data — kontrakter, sundhedsregistre, løn — indeholder fødselsnumre. Værktøjet har ingen logik for denne identifikatortype. Hvert fødselsnummer overses. Medarbejdernes sundheds- og løndata flyttes uden de kontroller, ÚOOÚ kræver. I en revision eller ved et databrud kan den lokale virksomhed ikke dokumentere "passende tekniske foranstaltninger" i henhold til GDPR artikel 32.
ÚOOÚ holder den lokale dataansvarlige ansvarlig. "Vores moderselskab valgte værktøjet" er ikke et gyldigt forsvar. GDPRs ansvarlighedsregel tillader det ikke.
Overholdelsestjekliste for fremstillingsvirksomheder
Disse kontroller gælder for industrivirksomheder med tyske moderselskabsværktøjer.
- Fødselsnummerdetektion: Både 9-tegns og 10-tegns formater. Køns-offset-månedshåndtering (50+). Modulus-11-kontrolværdi for 10-tegns varianter.
- Modersmålssproglig NER: spaCy
cs_core_newseller tilsvarende model. Generiske værktøjer viser 23% lavere NER-nøjagtighed for dette sprog. Lokale modeller lukker gabet. - Číslo OP-detektion: Občanský průkaz (nationalt ID-kort) er et 9-tegns nummer, der optræder ved siden af fødselsnummeret i mange dokumenttyper.
- IČO og DIČ: Virksomheds-ID og skattenumre optræder i kontrakter. Begge kræver dækning.
- Flersproget pipeline: Blandede miljøer indeholder dokumenter på det lokale sprog, tysk og engelsk. En enkelsproget pipeline overser krydssproglig samforekomst.
ÚOOÚ håndhæver konsekvent. Virksomheder, der fremlægger teknisk dokumentation i en revision, får langt lavere bøder. Virksomheder, der ikke kan fremvise det, har større eksponering.
For et bredere overblik over, hvordan nationale ID-numre skaber GDPR-eksponering, se vores EU-nationale skatte-ID-detektionsguide.
For en lignende nordisk identifikator, se vores Datatilsynet CPR tekniske guide.