ÚOOÚ en rodné číslo: geslachtscodering onder de AVG
Bijgewerkt voor 2026
De Tsjechische gegevensbeschermingsautoriteit is ÚOOÚ. Volledige naam: Úřad pro ochranu osobních údajů. Ze heeft in 2024 58 uitspraken gedaan. In veel zaken duikt één bevinding op. Het rodné číslo (geboortegetal) werd verwerkt zonder detectie. De gebruikte PII-tool was gebouwd voor het Duits of het Engels. Die had geen logica voor dit soort identifier. ÚOOÚ is duidelijk: tools moeten het rodné číslo detecteren met controlesomvalidatie en correcte verwerking van de geslachtsoffset.
Rodné číslo: bijzondere categoriegegevens door structuur
Het rodné číslo, of RČ, gebruikt het formaat JJMMDD/XXXX.
- JJ — laatste twee cijfers van het geboortejaar.
- MM — geboortemaand. Voor vrouwen wordt 50 opgeteld. Maand 01 wordt 51. Maand 12 wordt 62.
- DD — geboortedag.
- XXXX — een korte reeks van 3–4 cijfers plus een controlewaarde (modulus 11).
De maandoffset voor vrouwen maakt dit nummer tot een markering van biologisch geslacht. Die offset is niet toevallig. Het burgerregistratiesysteem maakt er gebruik van voor administratieve opzoeking. Artikel 9 van de AVG bestrijkt gegevens die persoonlijke kenmerken onthullen. Geslacht is er één van. Het standpunt van ÚOOÚ: elk document met een rodné číslo bevat gegevens die grenzen aan bijzondere categoriegegevens. Sterkere bescherming is vereist.
Hoe de controlewaarde werkt: Voor nummers van 10 tekens (afgegeven na 1954) moet de volledige reeks van 9 tekens zonder rest deelbaar zijn door 11. Voor nummers van 9 tekens (afgegeven vóór 1954) bestaat er geen controlewaarde. Tools moeten beide verwerken.
Wat ÚOOÚ als adequate detectie beschouwt
De technische richtsnoeren van ÚOOÚ uit 2024 voor PII-tools stellen drie vereisten.
Verwerking van geslachtsoffset: Nummers met maandwaarden 51–62 zijn geldige identifiers voor vrouwen. Een tool die die waarden behandelt als ongeldige datums, mist ruwweg de helft van het primaire ID van de volwassen vrouwelijke bevolking.
Formaatvariant: Geboorten van vóór 1954 leveren nummers van 9 tekens zonder controlewaarde op. Geboorten van na 1954 leveren nummers van 10 tekens met een controlewaarde op. Beide moeten worden ondersteund.
Contextsignalen: In documenten in de nationale taal verschijnt de identifier nabij labels zoals "Rodné číslo:", "RČ:" of "r.č.:". Taalbewuste NER helpt deze signalen te vinden, zelfs in vrije tekst.
Het probleem van de Duitse moedermaatschappij
67% van de bedrijven in het land zet PII-tools in die zijn geconfigureerd voor het Duits of het Engels. ÚOOÚ heeft dit vastgesteld in een onderzoek. De faalcyclus in de maakindustrie is voorspelbaar.
Een Duitse moedermaatschappij implementeert een scantool. Die is geconfigureerd voor Duitse identifiers. HR-data — contracten, gezondheidsdossiers, loonstroken — bevat geboortegetal. De tool heeft geen logica voor dit type identifier. Elk geboortegetal wordt gemist. Werknemersgezondheidsinformatie en loongegevens gaan verder zonder de maatregelen die ÚOOÚ vereist. Bij een audit of een inbreuk kan het lokale bedrijf niet aantonen dat er sprake is van "passende technische maatregelen" conform artikel 32 AVG.
ÚOOÚ houdt de lokale verwerkingsverantwoordelijke aansprakelijk. "Onze moedermaatschappij heeft de tool gekozen" is geen geldige verdediging. De verantwoordingsplicht van de AVG staat dat niet toe.
Nalevingschecklist voor maakbedrijven
Deze maatregelen gelden voor industriële bedrijven met tooling van een Duitse moedermaatschappij.
- Geboortetal-detectie: Zowel 9- als 10-tekenvarianten. Verwerking van de maandoffset voor vrouwen (50+). Modulus-11-controlewaarde voor varianten van 10 tekens.
- NER in de landstaal: spaCy
cs_core_newsof een gelijkwaardig model. Generieke tools tonen 23% lagere NER-nauwkeurigheid voor deze taal. Lokale modellen dichten het gat. - Číslo OP-detectie: Het občanský průkaz (nationale identiteitskaart) is een 9-tekennummer. Het verschijnt naast het geboortegetal in veel documenttypen.
- IČO en DIČ: Bedrijfs-ID en belastingnummers verschijnen in contracten. Beide hebben dekking nodig.
- Meertalige pijplijn: Gemengde omgevingen bevatten documenten in de landstaal, het Duits en het Engels. Een eentalige pijplijn mist taalgrensoverschrijdende co-occurrenties.
De handhaving door ÚOOÚ is consistent. Bedrijven die bij een audit technisch bewijs kunnen overleggen, krijgen doorgaans veel lagere boetes. Bedrijven die dat niet kunnen, lopen een hogere blootstelling.
Voor een breder overzicht van hoe nationale ID's AVG-blootstelling creëren, zie onze gids voor Europese nationale belasting-ID-detectie.
Voor een vergelijkbaar Noordeuropees identifier, zie onze Datatilsynet CPR technische gids.