ÚOOÚ i rodné číslo: kodowanie płci w świetle RODO
Zaktualizowano na 2026 rok
Czeski organ ochrony danych to ÚOOÚ — Úřad pro ochranu osobních údajů. W 2024 roku wydał 58 orzeczeń. W wielu z nich pojawia się ten sam wniosek: rodné číslo (numer urodzeniowy) był przetwarzany bez wykrycia. Stosowane narzędzie do wykrywania PII było skonfigurowane dla języka niemieckiego lub angielskiego i nie zawierało logiki obsługi tego identyfikatora. Stanowisko ÚOOÚ jest jednoznaczne: narzędzia muszą wykrywać rodné číslo z weryfikacją sumy kontrolnej i prawidłową obsługą przesunięcia płci.
Rodné číslo — dane szczególnej kategorii ze względu na strukturę
Rodné číslo, w skrócie RČ, ma format RRMMDD/XXXX.
- RR — dwie ostatnie cyfry roku urodzenia.
- MM — miesiąc urodzenia. W przypadku kobiet dodaje się 50: miesiąc 01 staje się 51, miesiąc 12 staje się 62.
- DD — dzień urodzenia.
- XXXX — ciąg 3–4 cyfr wraz z cyfrą kontrolną (modulus 11).
Przesunięcie miesiąca o 50 dla kobiet sprawia, że numer ten jest znacznikiem płci biologicznej. Nie jest to kwestia przypadkowa — system ewidencji ludności używa tego przesunięcia do celów administracyjnych. Artykuł 9 RODO obejmuje dane ujawniające cechy osobiste; płeć jest jedną z nich. ÚOOÚ stoi na stanowisku, że każdy dokument zawierający rodné číslo niesie dane o charakterze zbliżonym do szczególnej kategorii, co wymaga wzmocnionej ochrony.
Obliczanie cyfry kontrolnej: Dla numerów dziesięcioznakowych (wydawanych po 1954 roku) dziewięcioznakowa podstawa musi być podzielna przez 11. Dla numerów dziewięcioznakowych (wydawanych przed 1954 rokiem) cyfra kontrolna nie istnieje. Narzędzia muszą obsługiwać oba warianty.
Co ÚOOÚ uznaje za adekwatne wykrywanie
Wytyczne techniczne ÚOOÚ z 2024 roku dla narzędzi do wykrywania PII stawiają trzy wymagania.
Obsługa przesunięcia płci: Numery z wartościami miesiąca 51–62 są prawidłowymi identyfikatorami kobiet. Narzędzie traktujące te wartości jako nieprawidłowe daty pominie numerystykę dotyczącą niemal połowy dorosłych kobiet.
Warianty formatu: Urodzenia przed 1954 rokiem dają numery dziewięcioznakowe bez cyfry kontrolnej. Urodzenia po 1954 roku — dziesięcioznakowe z cyfrą kontrolną. Oba warianty muszą być obsługiwane.
Sygnały kontekstowe: W dokumentach w języku czeskim identyfikator pojawia się w sąsiedztwie etykiet takich jak „Rodné číslo:”, „RČ:” lub „r.č.:”. Rozpoznawanie encji z uwzględnieniem języka ułatwia odnajdywanie tych sygnałów nawet w tekście swobodnym.
Problem narzędzi skonfigurowanych dla firmy-matki z Niemiec
67% firm w Czechach wdraża narzędzia do wykrywania PII skonfigurowane pod języki niemiecki lub angielski — wynika to z badania ÚOOÚ. Typowy łańcuch błędów w sektorze produkcyjnym jest przewidywalny.
Niemiecka spółka-matka wdraża narzędzie skanujące skonfigurowane pod identyfikatory niemieckie. Dokumentacja kadrowa — umowy, dokumentacja medyczna, listy płac — zawiera numery urodzeniowe. Narzędzie nie ma logiki obsługi tego identyfikatora, więc każdy rodné číslo zostaje pominięty. Dane zdrowotne i płacowe pracowników trafiają dalej bez wymaganych przez ÚOOÚ mechanizmów kontrolnych. W przypadku audytu lub naruszenia lokalna firma nie może wykazać stosowania „odpowiednich środków technicznych” w rozumieniu artykułu 32 RODO.
ÚOOÚ traktuje lokalnego administratora jako odpowiedzialnego. Argument „firma-matka wybrała narzędzie” nie jest skuteczną obroną. Zasada rozliczalności RODO tego nie dopuszcza.
Lista kontrolna dla firm produkcyjnych
Poniższe mechanizmy kontrolne mają zastosowanie w firmach przemysłowych korzystających z narzędzi wdrożonych przez spółkę-matkę z Niemiec.
- Wykrywanie rodné číslo: Oba warianty — dziewięcio- i dziesięcioznakowy. Obsługa przesunięcia miesiąca dla kobiet (50+). Weryfikacja modulus-11 dla wariantów dziesięcioznakowych.
- NER w języku czeskim: spaCy
cs_core_newslub równoważny model. Narzędzia generyczne wykazują o 23% niższą skuteczność NER dla języka czeskiego — modele lokalne eliminują tę lukę. - Wykrywanie číslo OP: Obywatelski dowód osobisty (občanský průkaz) ma format dziewięcioznakowy i często pojawia się w dokumentach obok rodné číslo.
- IČO i DIČ: Numery identyfikacyjne podmiotów gospodarczych i numery podatkowe pojawiają się w umowach — oba wymagają obsługi.
- Wielojęzyczny potok przetwarzania: W środowiskach mieszanych dokumenty są sporządzane po czesku, niemiecku i angielsku. Potok jednojęzyczny pomija encje współwystępujące w różnych językach.
Egzekwowanie przepisów przez ÚOOÚ jest konsekwentne. Firmy przedstawiające dowody techniczne podczas audytu narażają się na znacznie niższe kary. Firmy, które nie są w stanie ich przedstawić, ponoszą większe ryzyko.
Szerokie omówienie ryzyka RODO związanego z krajowymi numerami identyfikacyjnymi znajdziesz w naszym przewodniku po wykrywaniu unijnych numerów podatkowych.
Podobny nordycki identyfikator omówiony jest w naszym technicznym przewodniku Datatilsynet dotyczącym numeru CPR.