ÚOOÚ и rodné číslo: кодирование пола в контексте GDPR
Обновлено для 2026 года
Чешский орган по защите данных — ÚOOÚ (Úřad pro ochranu osobních údajů). В 2024 году ведомство вынесло 58 решений. В числе повторяющихся выводов — обработка rodné číslo (родового номера) без его обнаружения: применяемый инструмент для работы с персональными данными был настроен для немецкого или английского языка и не содержал логики для этого идентификатора. Позиция ÚOOÚ однозначна: инструменты должны обнаруживать rodné číslo с проверкой контрольной суммы и корректной обработкой смещения пола.
Rodné číslo: данные особой категории в силу структуры
Rodné číslo (RČ) использует формат RRMMDD/XXXX.
- RR — последние две цифры года рождения.
- MM — месяц рождения. Для женщин прибавляется 50. Месяц 01 становится 51. Месяц 12 становится 62.
- DD — день рождения.
- XXXX — последовательность из 3–4 цифр плюс контрольное значение (по модулю 11).
Смещение месяца для женщин превращает этот номер в маркер биологического пола. Такое смещение не случайно — оно использовалось в системе регистрации актов гражданского состояния для административного поиска. Статья 9 GDPR охватывает данные, раскрывающие личные характеристики, в том числе пол. Позиция ÚOOÚ: любой документ с rodné číslo содержит данные, близкие к особой категории. К ним применяется усиленная защита.
Алгоритм проверки контрольного значения: для 10-символьных номеров (выданных после 1954 года) 9-символьная основа должна без остатка делиться на 11. Для 9-символьных номеров (выданных до 1954 года) контрольного значения нет. Инструменты должны поддерживать оба варианта.
Требования ÚOOÚ к надлежащему обнаружению
Техническое руководство ÚOOÚ 2024 года для инструментов обработки персональных данных устанавливает три требования.
Обработка смещения пола: номера со значениями месяца 51–62 являются действительными идентификаторами для женщин. Инструмент, интерпретирующий эти значения как недействительные даты, пропускает основной идентификатор примерно половины взрослого женского населения.
Варианты формата: рождённым до 1954 года соответствуют 9-символьные номера без контрольного значения; рождённым после 1954 года — 10-символьные номера с контрольным значением. Оба варианта должны поддерживаться.
Контекстные сигналы: в документах на чешском языке идентификатор появляется рядом с метками «Rodné číslo:», «RČ:» или «r.č.:». NER с поддержкой языка позволяет обнаруживать эти сигналы даже в тексте произвольной формы.
Проблема немецкой материнской компании
67% компаний в стране применяют инструменты обработки персональных данных, настроенные для немецкого или английского языка, — такой вывод был сделан по результатам обследования. В производственном секторе цепочка сбоев предсказуема.
Немецкая материнская компания внедряет инструмент сканирования, настроенный под немецкие идентификаторы. HR-данные — трудовые договоры, медицинские записи, расчётные ведомости — содержат родовые номера. Инструмент не имеет логики для этого типа идентификатора. Каждый родовой номер остаётся необнаруженным. Сведения о здоровье и заработке сотрудников передаются без мер контроля, требуемых ÚOOÚ. При проверке или инциденте безопасности местная компания не может подтвердить наличие «надлежащих технических мер» по статье 32 GDPR.
UOOÚ возлагает ответственность на местного контролёра. Аргумент «наша материнская компания выбрала инструмент» не является допустимым возражением: принцип подотчётности GDPR этого не допускает.
Чеклист соответствия для производственных компаний
Перечисленные меры контроля применяются к промышленным предприятиям, использующим инструменты немецкой материнской компании.
- Обнаружение родового номера: оба формата — 9- и 10-символьный. Обработка смещения месяца для пола (+50). Проверка контрольного значения по модулю 11 для 10-символьных вариантов.
- NER на родном языке: spaCy
cs_core_newsили эквивалентная модель. Универсальные инструменты показывают на 23% меньшую точность NER для этого языка. Локальные модели устраняют этот разрыв. - Обнаружение číslo OP: гражданское удостоверение (občanský průkaz) — 9-символьный номер. Он сопровождает родовой номер во многих типах документов.
- IČO и DIČ: идентификационный и налоговый номера юридического лица встречаются в договорах. Оба требуют охвата.
- Многоязычный конвейер: в смешанных средах документы существуют на чешском, немецком и английском языках. Однояязычный конвейер пропускает межязыковые совпадения.
Правоприменительная практика ÚOOÚ последовательна: компании, предоставляющие технические доказательства в ходе проверки, сталкиваются с существенно меньшими штрафами. Те, кто не может их представить, несут повышенный риск.
О том, как национальные идентификаторы создают риски по GDPR, — в нашем руководстве по обнаружению национальных налоговых ID в ЕС.
Схожий идентификатор в Скандинавии — в нашем техническом руководстве по CPR для Datatilsynet.