ÚOOÚ og rodné cislo: Kjønnskoding under GDPR
Oppdatert for 2026
Tsjekkias datatilsynsorgan er ÚOOÚ. Fullt navn: Úrad pro ochranu osobních údaju. Det utstedte 58 avgjørelser i 2024. Et funn forekommer på tvers av mange saker. Rodné cislo (fødselsnummer) ble behandlet uten deteksjon. PII-verktøyet som ble brukt, var bygget for tysk eller engelsk. Det hadde ingen logikk for denne identifikatoren. ÚOOÚ er tydelig: verktøy må detektere rodné cislo med sjekksumvalidering og korrekt kjønnsoffset-håndtering.
Rodné cislo: Særlig kategori-data etter struktur
Rodné cislo, eller RC, bruker formatet RRMMDD/XXXX.
- RR — de to siste sifrene i fødselsåret.
- MM — fødselsmåned. For kvinner legges 50 til. Måned 01 blir 51. Måned 12 blir 62.
- DD — fødselsdato.
- XXXX — en kort sekvens på 3–4 sifre pluss en kontrollverdi (modulus 11).
Kvinners måneds-offset gjør dette nummeret til et markør for biologisk kjønn. Det er ikke tilfeldig. Det sivile registreringssystemet bruker det for administrative oppslag. GDPR artikkel 9 dekker data som avslører personlige egenskaper. Kjønn er en av dem. ÚOOÚ's syn: ethvert dokument med et rodné cislo inneholder data som grenser til særlig kategori. Sterkere beskyttelse gjelder.
Slik fungerer kontrollverdien: For 10-tegns tall (utstedt etter 1954) må hele den 9-tegns basen dele seg jevnt på 11. For 9-tegns tall (utstedt før 1954) finnes ingen kontrollverdi. Verktøy må håndtere begge.
Hva ÚOOÚ kaller tilstrekkelig deteksjon
ÚOOÚ's tekniske veiledning for 2024 for PII-verktøy setter tre krav.
Kjønnsoffset-håndtering: Tall med månedsverdier 51–62 er gyldige identifikatorer for kvinner. Et verktøy som behandler disse som ugyldige datoer, bommer på omtrent halvparten av den voksne kvinnebefolkningens primær-ID.
Formatvarianter: Fødsler før 1954 gir 9-tegns tall uten kontrollverdi. Fødsler etter 1954 gir 10-tegns tall med én. Begge må støttes.
Kontekstsignaler: I innfødtspråklige dokumenter vises identifikatoren nær merkelapper som "Rodné cislo:", "RC:" eller "r.c.:". Språkbevisst NER hjelper å finne disse signalene selv i friformstekst.
Problemet med tyske morselskaper
67% av virksomheter i landet bruker tysk- eller engelskinnstilte PII-verktøy. ÚOOÚ fant dette i en undersøkelse. Feilkjeden i produksjon er forutsigbar.
Et tysk morselskap ruller ut et skannerverktøy. Det er satt opp for tyske identifikatorer. HR-data — kontrakter, helseregistre, lønn — inneholder fødselsnumre. Verktøyet har ingen logikk for denne identifikatoren. Hvert fødselsnummer overses. Ansattes helse- og lønnsdata flyttes uten kontrollene ÚOOÚ krever. I et revisjon eller brudd kan ikke det lokale selskapet vise "egnede tekniske tiltak" etter GDPR artikkel 32.
ÚOOÚ holder den lokale behandlingsansvarlige ansvarlig. "Morselskapet vårt valgte verktøyet" er ikke et gyldig forsvar. GDPRs ansvarlighetsprinsipp tillater det ikke.
Overholdelsessjekkliste for produksjonsvirksomheter
Disse kontrollene gjelder for industrivirksomheter med tyske morselskapsverktøy.
- Fødselsnummerdeteksjon: Både 9-tegns og 10-tegns formater. Kjønnsoffset månedshåndtering (50+). Modulus-11 kontrollverdi for 10-tegns varianter.
- Innfødtspråklig NER: spaCy
cs_core_newseller tilsvarende modell. Generiske verktøy viser 23% lavere NER-nøyaktighet for dette språket. Lokale modeller lukker gapet. - Cislo OP-deteksjon: Obcanský prukaz (nasjonalt ID-kort) er et 9-tegns nummer. Det forekommer ved siden av fødselsnummeret i mange dokumenttyper.
- ICO og DIC: Bedrifts-ID og skattenumre forekommer i kontrakter. Begge trenger dekning.
- Flerspråklig pipeline: Blandede miljøer har dokumenter på lokalt språk, tysk og engelsk. En enkeltspråklig pipeline bommer på kryss-språklig sam-forekomst.
ÚOOÚ-håndhevelse er konsekvent. Virksomheter som viser tekniske bevis i en revisjon, møter mye lavere bøter. Virksomheter som ikke kan vise det, møter høyere eksponering.
For et bredere blikk på hvordan nasjonale ID-er skaper GDPR-eksponering, se vår EU-guide for nasjonale skatte-ID-deteksjon.
For en lignende nordisk identifikator, se vår Datatilsynet CPR tekniske guide.