anonym.legal

By · Last updated 2026-06-05

Назад до блогуGDPR та відповідність

Чеський rodné číslo: кодування статі та GDPR

Чеський rodné číslo кодує стать через зміщення місяця на 50, що робить його даними спеціальної категорії за Статтею 9 GDPR. 67% чеських компаній використовують інструменти, налаштовані для Німеччини.

June 5, 20267 хв читання
Czech ÚOOÚrodné číslo detectionCzech GDPR compliancemanufacturing data protectionCentral Europe

ÚOOÚ та rodné číslo: кодування статі в контексті GDPR

Оновлено для 2026 року

Чеський орган захисту даних — ÚOOÚ. Повна назва — Úřad pro ochranu osobních údajů. У 2024 році він виніс 58 рішень. Один висновок повторюється в багатьох справах. Rodné číslo (номер народження) оброблявся без виявлення. Використовуваний PII-інструмент був побудований для Німеччини або англомовних ринків. Він не мав логіки для цього ідентифікатора. Позиція ÚOOÚ однозначна: інструменти повинні виявляти rodné číslo з перевіркою контрольної суми та правильною обробкою зміщення статі.

Rodné číslo: дані спеціальної категорії за своєю структурою

Rodné číslo, або RČ, використовує формат RRMMDD/XXXX.

  • RR — останні дві цифри року народження.
  • MM — місяць народження. Для жінок додають 50. Місяць 01 стає 51. Місяць 12 стає 62.
  • DD — день народження.
  • XXXX — коротка послідовність із 3–4 цифр плюс контрольне значення (модуль 11).

Зміщення місяця для жінок робить цей номер маркером біологічної статі. Це зміщення не є випадковим. Система реєстрації актів цивільного стану використовує його для адміністративного пошуку. Стаття 9 GDPR поширюється на дані, що розкривають особисті характеристики. Стать — одна з них. Позиція ÚOOÚ: будь-який документ із rodné číslo несе дані, суміжні зі спеціальною категорією. Застосовується більш суворий захист.

Як працює контрольне значення: для 10-символьних номерів (виданих після 1954 року) повна 9-символьна база має ділитися на 11 без остачі. Для 9-символьних номерів (виданих до 1954 року) контрольне значення відсутнє. Інструменти повинні підтримувати обидва варіанти.

Що ÚOOÚ вважає належним виявленням

Технічне керівництво ÚOOÚ 2024 року для PII-інструментів встановлює три вимоги.

Обробка зміщення статі: номери зі значеннями місяця 51–62 є дійсними ідентифікаторами для жінок. Інструмент, що трактує їх як недійсні дати, пропускає приблизно половину жіночого дорослого населення за основним ідентифікатором.

Варіанти формату: народжені до 1954 року мають 9-символьні номери без контрольного значення. Народжені після 1954 року — 10-символьні з контрольним значенням. Обидва варіанти мають підтримуватися.

Контекстні сигнали: у документах рідною мовою ідентифікатор зустрічається поруч із мітками на кшталт «Rodné číslo:», «RČ:» або «r.č.:». NER із підтримкою мови допомагає знаходити ці сигнали навіть у вільному тексті.

Проблема материнської компанії з Німеччини

67% компаній у країні використовують PII-інструменти, налаштовані для Німеччини або англомовних ринків. ÚOOÚ встановив це в ході дослідження. Ланцюжок помилок у виробництві є передбачуваним.

Німецька материнська компанія розгортає інструмент сканування, налаштований на німецькі ідентифікатори. Кадрові дані — контракти, медичні записи, відомості про заробітну плату — містять номери народження. Інструмент не має логіки для цього типу ідентифікатора. Кожен номер народження пропускається. Медичні та платіжні дані працівників переміщуються без засобів контролю, яких вимагає ÚOOÚ. У разі аудиту або витоку місцева компанія не може довести «відповідні технічні заходи» за Статтею 32 GDPR.

ÚOOÚ покладає відповідальність на місцевого контролера. «Наша материнська компанія обрала інструмент» — не є дійсним захистом. Правило підзвітності GDPR не дозволяє цього.

Контрольний список відповідності для виробничих компаній

Ці заходи контролю застосовуються до промислових компаній з інструментарієм від німецьких материнських компаній.

  • Виявлення номера народження: обидва варіанти — 9-символьний і 10-символьний. Обробка зміщення місяця для жінок (50+). Перевірка контрольного значення за модулем 11 для 10-символьних варіантів.
  • NER рідною мовою: spaCy cs_core_news або аналогічна модель. Загальні інструменти демонструють на 23% нижчу точність NER для цієї мови. Локальні моделі закривають цю прогалину.
  • Виявлення číslo OP: občanský průkaz (національне посвідчення особи) — 9-символьний номер. Він зустрічається поруч із номером народження в багатьох типах документів.
  • IČO та DIČ: ідентифікатор підприємства та податковий номер зустрічаються в контрактах. Обидва потребують покриття.
  • Багатомовний конвеєр: у змішаних середовищах документи бувають місцевою мовою, німецькою та англійською. Одномовний конвеєр пропускає збіги в різних мовах.

Виконання ÚOOÚ послідовне. Компанії, що надають технічні докази під час аудиту, стикаються з набагато нижчими штрафами. Компанії, що не можуть їх надати, мають вищий ризик.

Для ширшого погляду на те, як національні ідентифікатори створюють ризик за GDPR, дивіться наш посібник з виявлення EU national tax ID.

Для аналогічного скандинавського ідентифікатора дивіться наш технічний посібник Datatilsynet CPR.

Джерела

Готові захистити свої дані?

Почніть анонімізувати PII з 285+ типами сутностей на 48 мовах.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.