ÚOOÚ y Rodné Číslo: Codificación de Género bajo el RGPD
Actualizado para 2026
La autoridad de protección de datos checa es la ÚOOÚ. En su forma completa: Úřad pro ochranu osobních údajů. Emitió 58 decisiones de aplicación en 2024. Un hallazgo aparece en muchos casos. El rodné číslo (número de nacimiento) fue procesado sin detección. La herramienta PII utilizada estaba diseñada para alemán o inglés. No tenía lógica para este identificador. La ÚOOÚ es clara: las herramientas deben detectar el rodné číslo con validación de suma de comprobación y manejo correcto del desplazamiento de género.
Rodné Číslo: Datos de Categoría Especial por Estructura
El rodné číslo, o RČ, usa el formato RRMMDD/XXXX.
- RR — dos últimos dígitos del año de nacimiento.
- MM — mes de nacimiento. Para mujeres, se añade 50. El mes 01 se convierte en 51. El mes 12 se convierte en 62.
- DD — día de nacimiento.
- XXXX — una secuencia corta de 3–4 dígitos más un valor de verificación (módulo 11).
El desplazamiento de mes para mujeres hace de este número un indicador estructural del sexo biológico. Ese desplazamiento no es accidental. El sistema de registro civil lo usa para búsquedas administrativas. El artículo 9 del RGPD cubre datos que revelan características personales. El sexo es una de ellas. Según la ÚOOÚ: cualquier documento con un rodné číslo lleva datos de categoría especial adyacente. Se aplica una protección reforzada.
Cómo funciona el valor de verificación: Para números de 10 caracteres (emitidos después de 1954), la base de 9 caracteres debe ser divisible entre 11. Para números de 9 caracteres (antes de 1954), no existe valor de verificación. Las herramientas deben manejar ambos.
Lo que la ÚOOÚ Llama Detección Adecuada
La guía técnica de la ÚOOÚ de 2024 para herramientas PII establece tres requisitos.
Manejo del desplazamiento de género: Los números con valores de mes 51–62 son identificadores válidos para mujeres. Una herramienta que los trate como fechas no válidas omite aproximadamente la mitad de la población femenina adulta.
Variantes de formato: Los nacimientos anteriores a 1954 producen números de 9 caracteres sin valor de verificación. Los posteriores a 1954 producen números de 10 caracteres con uno. Ambos deben ser compatibles.
Señales contextuales: En documentos en lengua materna, el identificador aparece cerca de etiquetas como "Rodné číslo:", "RČ:" o "r.č.:". El NER con conciencia lingüística ayuda a encontrar estas señales incluso en texto no estructurado.
El Problema de la Empresa Matriz Alemana
El 67 % de las empresas del país implementan herramientas PII configuradas para alemán o inglés. La ÚOOÚ lo documentó en una encuesta. La cadena de fallos en la fabricación es predecible.
Una empresa matriz alemana despliega una herramienta de análisis. Está configurada para identificadores alemanes. Los datos de RRHH — contratos, registros de salud, nóminas — contienen números de nacimiento. La herramienta no tiene lógica para este tipo de identificador. Se omite cada número de nacimiento. Los datos de salud y salario de los empleados se mueven sin los controles que la ÚOOÚ requiere. En una auditoría o violación, la filial local no puede demostrar "medidas técnicas apropiadas" bajo el artículo 32 del RGPD.
La ÚOOÚ hace responsable al responsable del tratamiento local. "Nuestra empresa matriz eligió la herramienta" no es una defensa válida. La regla de responsabilidad del RGPD no lo permite.
Lista de Verificación de Cumplimiento para Empresas Industriales
Estos controles se aplican a empresas industriales con herramientas de la empresa matriz alemana.
- Detección del número de nacimiento: Formatos de 9 y 10 caracteres. Manejo del desplazamiento de mes de género (50+). Valor de verificación módulo 11 para variantes de 10 caracteres.
- NER en lengua materna: spaCy
cs_core_newso un modelo equivalente. Las herramientas genéricas muestran un 23 % menos de precisión NER para este idioma. Los modelos específicos del idioma cierran la brecha. - Detección del Číslo OP: El občanský průkaz (documento nacional de identidad) es un número de 9 caracteres. Aparece junto al número de nacimiento en muchos tipos de documentos.
- IČO y DIČ: Los números de identificación empresarial y fiscal aparecen en los contratos. Ambos necesitan cobertura.
- Pipeline multilingüe: Los entornos mixtos tienen documentos en el idioma local, alemán e inglés. Un pipeline monolingüe omite las co-ocurrencias entre idiomas.
La aplicación de la ÚOOÚ es coherente. Las empresas que presentan evidencia técnica en una auditoría enfrentan multas mucho menores. Las que no pueden hacerlo tienen mayor exposición.
Para una visión más amplia de cómo los identificadores nacionales crean riesgos bajo el RGPD, consulte nuestra guía de detección de identificadores fiscales nacionales de la UE.
Para un identificador nórdico similar, consulte nuestra guía técnica CPR de Datatilsynet.