O Úřad pro ochranu osobních údajů (ÚOOÚ) da República Tcheca emitiu 58 decisões de fiscalização em 2024. Uma constatação aparece em vários casos: o rodné číslo (número de nascimento) foi processado sem detecção porque a ferramenta de PII implantada estava configurada para o idioma alemão ou inglês, faltando a lógica de identificador específica da Tchequia. A orientação do ÚOOÚ é clara — as ferramentas devem implementar a detecção do rodné číslo com validação de checksum e tratamento correto da codificação de gênero.
Rodné Číslo: Dados de Categoria Especial por Estrutura
O formato do rodné číslo (abreviado RČ): RRMMDD/XXXX onde:
- RR = últimos dois dígitos do ano de nascimento
- MM = mês de nascimento (mulheres: 50 adicionado — mês 01 se torna 51, mês 12 se torna 62)
- DD = dia de nascimento
- XXXX = número sequencial (3-4 dígitos) + dígito de verificação (módulo 11)
A codificação do mês feminino (MM + 50) faz do rodné číslo um indicador estrutural do sexo biológico. Isso não é incidental — o sistema de registro civil tcheco incorpora deliberadamente o gênero no número para fins de consulta administrativa. O artigo 9 do GDPR cobre dados que "revelam" características de pessoas naturais — o sexo sendo uma delas. A interpretação do ÚOOÚ: qualquer documento contendo rodné číslo contém de fato dados adjacentes à categoria especial que requerem proteção aumentada.
Dígito de verificação: Para rodné číslo com 10 dígitos (emitidos após 1954), o dígito de verificação torna o número inteiro de 9 dígitos divisível por 11. Para números de 9 dígitos (antes de 1954), nenhum dígito de verificação é aplicado. As ferramentas devem lidar com ambas as variantes.
Orientação Técnica do ÚOOÚ: O que "Detecção Adequada" Significa
A orientação técnica de 2024 do ÚOOÚ para ferramentas de PII tchecas especifica:
Tratamento de offset de gênero: As ferramentas devem identificar corretamente os números de rodné číslo com valores de mês 51-62 (codificação feminina) como RČ válidos, e não interpretá-los erroneamente como datas inválidas. A maioria das cidadãs adultas tchecas possui rodné čísla com valores de mês 51-62 — ferramentas que rejeitam esses como "formato de data inválido" perdem aproximadamente metade do identificador primário da população feminina tcheca.
Números de 9 dígitos vs. 10 dígitos: Nascimentos antes de 1954 usam rodné čísla de 9 dígitos sem dígito de verificação. Após 1954, usam 10 dígitos com dígito de verificação. As ferramentas devem suportar ambos os formatos.
Detecção de contexto: Em documentos em língua tcheca, o rodné číslo geralmente aparece em um de vários contextos: "Rodné číslo:", "RČ:", "r.č.:", ou embutido em formulários. O NER em tcheco ajuda a identificar esses contextos mesmo quando o documento não está explicitamente estruturado.
Contexto da Indústria Tcheca: A Configuração da Empresa Mãe Alemã
67% das empresas tchecas utilizam ferramentas de PII configuradas para o alemão ou inglês — documentado na pesquisa do ÚOOÚ. O modo de falha na indústria tcheca:
- A empresa mãe alemã implanta uma ferramenta de escaneamento de PII integrada ao SAP configurada para identificadores alemães
- Os dados de RH tchecos (contratos de trabalho, registros de saúde, folha de pagamento) contêm rodné čísla
- A ferramenta alemã não implementa a lógica do rodné číslo — perde todos os números de nascimento dos funcionários tchecos
- Os dados de saúde e salário dos funcionários tchecos são processados sem a proteção em nível de identificador que o ÚOOÚ exige
- Em caso de violação de dados ou auditoria do ÚOOÚ, a subsidiária tcheca não pode demonstrar "medidas técnicas adequadas" sob o artigo 32 do GDPR
O ÚOOÚ responsabiliza o controlador tcheco (a subsidiária local) — não o fornecedor da ferramenta alemã. A defesa de que "nossa empresa mãe selecionou essa ferramenta" não satisfaz o requisito de responsabilidade do GDPR.
Lista de Verificação de Conformidade da Indústria Tcheca
Para organizações de manufatura e industriais tchecas com ferramentas de empresas mães alemãs:
- Detecção de rodné číslo: Ambos os formatos de 9 dígitos e 10 dígitos, com tratamento de mês com offset de gênero (50+), com dígito de verificação de módulo 11 para variantes de 10 dígitos
- NER em língua tcheca: spaCy cs_core_news ou equivalente — 23% menos precisão do que o alemão para ferramentas genéricas; modelos específicos para tcheco fecham essa lacuna
- Číslo OP (občanský průkaz): detecção do número do cartão de identidade nacional de 9 caracteres
- IČO/DIČ: números de identificação de negócios e registro fiscal em contratos
- Pipeline multilíngue: processamento em tcheco + alemão + inglês para ambientes de documentos de manufatura em múltiplas línguas
O padrão de fiscalização do ÚOOÚ mostra que as organizações de manufatura tchecas que podem demonstrar essas capacidades em resposta a um questionário de auditoria — com evidências técnicas, não apenas declarações de política — recebem uma exposição a penalidades significativamente menor do que aquelas que não podem.
Fontes: