Чешский Úřad pro ochranu osobních údajů (ÚOOÚ) вынес 58 решений в области правоприменения в 2024 году. В нескольких делах обнаружен один и тот же паттерн: rodné číslo (номер рождения) обрабатывался без обнаружения, поскольку развёрнутый инструмент PII был настроен для немецкого или английского языка и не имел логики для чешских идентификаторов. Руководство ÚOOÚ недвусмысленно: инструменты должны реализовывать обнаружение rodné číslo с проверкой контрольной суммы и корректной обработкой кодирования пола.
Rodné číslo: данные специальной категории по своей структуре
Формат rodné číslo (сокращённо RČ): RRMMDD/XXXX, где:
- RR = последние две цифры года рождения
- MM = месяц рождения (для женщин: +50 — месяц 01 становится 51, месяц 12 становится 62)
- DD = день рождения
- XXXX = порядковый номер (3–4 цифры) + контрольная цифра (modulus 11)
Кодирование женского месяца (MM + 50) делает rodné číslo структурным индикатором биологического пола. Это не случайно — чешская система гражданской регистрации намеренно встраивает пол в номер для административных целей. Статья 9 GDPR охватывает данные, «раскрывающие» характеристики физических лиц, в том числе биологический пол. Интерпретация ÚOOÚ: любой документ, содержащий rodné číslo, де-факто содержит данные, смежные со специальными категориями, требующие повышенной защиты.
Контрольная цифра: Для rodné číslo из 10 цифр (выданных после 1954 года) контрольная цифра обеспечивает делимость всего 9-значного числа на 11. Для 9-значных номеров (до 1954 года) контрольная цифра не применяется. Инструменты должны поддерживать оба варианта.
Техническое руководство ÚOOÚ: что означает «адекватное обнаружение»
Техническое руководство ÚOOÚ 2024 года для чешских инструментов PII определяет:
Обработка смещения пола: Инструменты должны корректно идентифицировать rodné číslo с значениями месяца 51–62 (кодирование для женщин) как действительные RČ, а не ошибочно отвергать их как недействительные даты. Большинство чешских взрослых женщин имеют rodné čísla со значениями месяца 51–62 — инструменты, отклоняющие их как «недействительный формат даты», пропускают приблизительно половину первичных идентификаторов женского населения Чехии.
9-значный vs. 10-значный: Рождённые до 1954 года используют 9-значные rodné čísla без контрольной цифры. После 1954-го — 10-значные с контрольной цифрой. Инструменты должны поддерживать оба формата.
Контекстное обнаружение: В чешскоязычных документах rodné číslo обычно встречается в одном из нескольких контекстов: «Rodné číslo:», «RČ:», «r.č.:» или встроен в формы. Чешский NER помогает идентифицировать эти контексты даже в неструктурированных документах.
Чешское производство: конфигурация с немецкой головной компанией
67% чешских предприятий развёртывают инструменты PII, настроенные для немецкого или английского языка, — что задокументировано в опросе ÚOOÚ. Типичная схема сбоя в чешском производстве:
- Немецкая головная компания развёртывает интегрированный с SAP инструмент сканирования PII, настроенный для немецких идентификаторов
- Чешские данные HR (трудовые договоры, медицинские записи, расчёт заработной платы) содержат rodné čísla
- Немецкий инструмент не реализует логику rodné číslo — пропускает все номера рождения чешских сотрудников
- Медицинские данные и данные о зарплате чешских сотрудников обрабатываются без защиты на уровне идентификатора, которой требует ÚOOÚ
- В случае утечки данных или аудита ÚOOÚ чешская «дочка» не может продемонстрировать «надлежащие технические меры» по статье 32 GDPR
UOOU возлагает ответственность на чешского контролёра (местную дочернюю компанию), а не на поставщика немецкого инструмента. Аргумент «наша головная компания выбрала этот инструмент» не удовлетворяет требованию GDPR об ответственности.
Контрольный список соответствия для чешского производства
Для чешских производственных и промышленных организаций с инструментами немецкой головной компании:
- Обнаружение rodné číslo: Как 9-значный, так и 10-значный форматы, с обработкой месяца со смещением пола (+50), с проверкой по modulus-11 для 10-значных вариантов
- Чешский NER: spaCy cs_core_news или аналог — точность на 23% ниже, чем для немецкого, у универсальных инструментов; чешские модели закрывают этот разрыв
- Číslo OP (občanský průkaz): Обнаружение 9-значного номера национального удостоверения личности
- IČO/DIČ: Идентификационные номера предприятий и налоговой регистрации в договорах
- Многоязычный пайплайн: Обработка чешского + немецкого + английского языков для смешанноязычной документальной среды производства
Структура правоприменения ÚOOÚ показывает, что чешские производственные организации, способные продемонстрировать эти возможности в ответ на анкету аудита — с техническими доказательствами, а не просто политическими заявлениями, — сталкиваются со значительно меньшей ответственностью, чем те, кто этого не может.
Источники: