ÚOOÚ e Rodné Číslo: Codificação de Gênero sob o RGPD
Atualizado para 2026
A autoridade de proteção de dados da República Checa é a ÚOOÚ. Por extenso: Úřad pro ochranu osobních údajů. Ela emitiu 58 decisões de aplicação em 2024. Uma constatação aparece em muitos casos. O rodné číslo (número de nascimento) foi processado sem detecção. A ferramenta PII utilizada foi construída para alemão ou inglês. Não tinha lógica para este identificador. A ÚOOÚ é direta: as ferramentas devem detectar o rodné číslo com validação de soma de verificação e tratamento correto do deslocamento de gênero.
Rodné Číslo: Dados de Categoria Especial por Estrutura
O rodné číslo, ou RČ, usa o formato RRMMDD/XXXX.
- RR — dois últimos dígitos do ano de nascimento.
- MM — mês de nascimento. Para mulheres, 50 é adicionado. O mês 01 torna-se 51. O mês 12 torna-se 62.
- DD — dia de nascimento.
- XXXX — uma sequência curta de 3–4 dígitos mais um valor de verificação (módulo 11).
O deslocamento do mês para mulheres torna este número um indicador estrutural do sexo biológico. Esse deslocamento não é acidental. O sistema de registro civil o utiliza para consultas administrativas. O Artigo 9 do RGPD abrange dados que revelam características pessoais. O sexo é uma delas. Segundo a ÚOOÚ: qualquer documento com um rodné číslo carrega dados de categoria adjacente especial. Proteção reforçada se aplica.
Como funciona o valor de verificação: Para números de 10 caracteres (emitidos após 1954), a base de 9 caracteres deve ser divisível por 11. Para números de 9 caracteres (antes de 1954), não existe valor de verificação. As ferramentas devem suportar ambos.
O que a ÚOOÚ Chama de Detecção Adequada
A orientação técnica de 2024 da ÚOOÚ para ferramentas PII estabelece três requisitos.
Tratamento do deslocamento de gênero: Números com valores de mês 51–62 são identificadores válidos para mulheres. Uma ferramenta que os trata como datas inválidas ignora aproximadamente metade da população feminina adulta.
Variantes de formato: Nascimentos antes de 1954 produzem números de 9 caracteres sem valor de verificação. Nascimentos após 1954 produzem números de 10 caracteres com um. Ambos devem ser suportados.
Sinais contextuais: Em documentos na língua nativa, o identificador aparece perto de rótulos como "Rodné číslo:", "RČ:" ou "r.č.:". O NER com consciência linguística ajuda a encontrar esses sinais mesmo em texto não estruturado.
O Problema da Empresa-Mãe Alemã
67% das empresas no país implantam ferramentas PII configuradas para alemão ou inglês. A ÚOOÚ documentou isso em uma pesquisa. A cadeia de falhas na manufatura é previsível.
Uma empresa-mãe alemã implanta uma ferramenta de varredura. Ela está configurada para identificadores alemães. Os dados de RH — contratos, registros de saúde, folha de pagamento — contêm números de nascimento. A ferramenta não tem lógica para este tipo de identificador. Cada número de nascimento é ignorado. Os dados de saúde e salário dos funcionários se movem sem os controles que a ÚOOÚ exige. Em uma auditoria ou violação, a subsidiária local não pode demonstrar "medidas técnicas adequadas" sob o Artigo 32 do RGPD.
A ÚOOÚ responsabiliza o controlador local. "Nossa empresa-mãe escolheu a ferramenta" não é uma defesa válida. A regra de responsabilização do RGPD não permite isso.
Lista de Verificação de Conformidade para Empresas Industriais
Esses controles se aplicam a empresas industriais com ferramentas da empresa-mãe alemã.
- Detecção do número de nascimento: Formatos de 9 e 10 caracteres. Tratamento do deslocamento de mês de gênero (50+). Valor de verificação módulo 11 para variantes de 10 caracteres.
- NER na língua nativa: spaCy
cs_core_newsou modelo equivalente. Ferramentas genéricas mostram 23% menos precisão de NER para este idioma. Modelos específicos do idioma fecham a lacuna. - Detecção do Číslo OP: O občanský průkaz (cartão de identidade nacional) é um número de 9 caracteres. Ele aparece junto ao número de nascimento em muitos tipos de documentos.
- IČO e DIČ: Números de identificação empresarial e fiscal aparecem em contratos. Ambos precisam de cobertura.
- Pipeline multilíngue: Ambientes mistos têm documentos no idioma local, alemão e inglês. Um pipeline monolíngue perde co-ocorrências entre idiomas.
A aplicação da ÚOOÚ é consistente. Empresas que apresentam evidências técnicas em uma auditoria enfrentam multas muito menores. Empresas que não conseguem têm maior exposição.
Para uma visão mais ampla de como os identificadores nacionais criam riscos sob o RGPD, consulte nosso guia de detecção de identificadores fiscais nacionais da UE.
Para um identificador nórdico similar, consulte nosso guia técnico CPR do Datatilsynet.