anonym.legal
Назад к блогуGDPR и соблюдение

ÚOOÚ Чехии: кодирование пола в rodné číslo и...

Чешское rodné číslo кодирует пол через смещение месяца на 50 — что делает его данными специальной категории по статье 9 GDPR.

April 21, 20267 мин чтения
Czech ÚOOÚrodné číslo detectionCzech GDPR compliancemanufacturing data protectionCentral Europe

Чешский Úřad pro ochranu osobních údajů (ÚOOÚ) вынес 58 решений в области правоприменения в 2024 году. В нескольких делах обнаружен один и тот же паттерн: rodné číslo (номер рождения) обрабатывался без обнаружения, поскольку развёрнутый инструмент PII был настроен для немецкого или английского языка и не имел логики для чешских идентификаторов. Руководство ÚOOÚ недвусмысленно: инструменты должны реализовывать обнаружение rodné číslo с проверкой контрольной суммы и корректной обработкой кодирования пола.

Rodné číslo: данные специальной категории по своей структуре

Формат rodné číslo (сокращённо RČ): RRMMDD/XXXX, где:

  • RR = последние две цифры года рождения
  • MM = месяц рождения (для женщин: +50 — месяц 01 становится 51, месяц 12 становится 62)
  • DD = день рождения
  • XXXX = порядковый номер (3–4 цифры) + контрольная цифра (modulus 11)

Кодирование женского месяца (MM + 50) делает rodné číslo структурным индикатором биологического пола. Это не случайно — чешская система гражданской регистрации намеренно встраивает пол в номер для административных целей. Статья 9 GDPR охватывает данные, «раскрывающие» характеристики физических лиц, в том числе биологический пол. Интерпретация ÚOOÚ: любой документ, содержащий rodné číslo, де-факто содержит данные, смежные со специальными категориями, требующие повышенной защиты.

Контрольная цифра: Для rodné číslo из 10 цифр (выданных после 1954 года) контрольная цифра обеспечивает делимость всего 9-значного числа на 11. Для 9-значных номеров (до 1954 года) контрольная цифра не применяется. Инструменты должны поддерживать оба варианта.

Техническое руководство ÚOOÚ: что означает «адекватное обнаружение»

Техническое руководство ÚOOÚ 2024 года для чешских инструментов PII определяет:

Обработка смещения пола: Инструменты должны корректно идентифицировать rodné číslo с значениями месяца 51–62 (кодирование для женщин) как действительные RČ, а не ошибочно отвергать их как недействительные даты. Большинство чешских взрослых женщин имеют rodné čísla со значениями месяца 51–62 — инструменты, отклоняющие их как «недействительный формат даты», пропускают приблизительно половину первичных идентификаторов женского населения Чехии.

9-значный vs. 10-значный: Рождённые до 1954 года используют 9-значные rodné čísla без контрольной цифры. После 1954-го — 10-значные с контрольной цифрой. Инструменты должны поддерживать оба формата.

Контекстное обнаружение: В чешскоязычных документах rodné číslo обычно встречается в одном из нескольких контекстов: «Rodné číslo:», «RČ:», «r.č.:» или встроен в формы. Чешский NER помогает идентифицировать эти контексты даже в неструктурированных документах.

Чешское производство: конфигурация с немецкой головной компанией

67% чешских предприятий развёртывают инструменты PII, настроенные для немецкого или английского языка, — что задокументировано в опросе ÚOOÚ. Типичная схема сбоя в чешском производстве:

  1. Немецкая головная компания развёртывает интегрированный с SAP инструмент сканирования PII, настроенный для немецких идентификаторов
  2. Чешские данные HR (трудовые договоры, медицинские записи, расчёт заработной платы) содержат rodné čísla
  3. Немецкий инструмент не реализует логику rodné číslo — пропускает все номера рождения чешских сотрудников
  4. Медицинские данные и данные о зарплате чешских сотрудников обрабатываются без защиты на уровне идентификатора, которой требует ÚOOÚ
  5. В случае утечки данных или аудита ÚOOÚ чешская «дочка» не может продемонстрировать «надлежащие технические меры» по статье 32 GDPR

UOOU возлагает ответственность на чешского контролёра (местную дочернюю компанию), а не на поставщика немецкого инструмента. Аргумент «наша головная компания выбрала этот инструмент» не удовлетворяет требованию GDPR об ответственности.

Контрольный список соответствия для чешского производства

Для чешских производственных и промышленных организаций с инструментами немецкой головной компании:

  • Обнаружение rodné číslo: Как 9-значный, так и 10-значный форматы, с обработкой месяца со смещением пола (+50), с проверкой по modulus-11 для 10-значных вариантов
  • Чешский NER: spaCy cs_core_news или аналог — точность на 23% ниже, чем для немецкого, у универсальных инструментов; чешские модели закрывают этот разрыв
  • Číslo OP (občanský průkaz): Обнаружение 9-значного номера национального удостоверения личности
  • IČO/DIČ: Идентификационные номера предприятий и налоговой регистрации в договорах
  • Многоязычный пайплайн: Обработка чешского + немецкого + английского языков для смешанноязычной документальной среды производства

Структура правоприменения ÚOOÚ показывает, что чешские производственные организации, способные продемонстрировать эти возможности в ответ на анкету аудита — с техническими доказательствами, а не просто политическими заявлениями, — сталкиваются со значительно меньшей ответственностью, чем те, кто этого не может.

Источники:

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.