UOOU i rodno cislo: Kodiranje pola prema GDPR-u
Azurirano za 2026.
Ceski organ za zastitu podataka je UOOU. Puno ime mu je Urad pro ochranu osobnich udaju. Izdao je 58 odluka u 2024. godini. Jedan nalaz pojavljuje se u mnogim slucajevima. Rodno cislo (maticni broj) je obradjivano bez detekcije. Koristeni PII alat je bio napravljen za nemacki ili engleski. Nije imao logiku za ovaj tip identifikatora. UOOU je jasan: alati moraju detektovati rodno cislo sa validacijom kontrolne sume i ispravnim rukovanjem pomerajem pola.
Rodno cislo: Posebna kategorija podataka po strukturi
Rodno cislo, ili RC, koristi format RRMMDD/XXXX.
- RR - poslednje dve cifre godine rodjenja.
- MM - mesec rodjenja. Za zene, dodaje se 50. Mesec 01 postaje 51. Mesec 12 postaje 62.
- DD - dan rodjenja.
- XXXX - kratki niz od 3-4 cifre plus kontrolna vrednost (modulus 11).
Pomeraj meseca za zene cini ovaj broj markerom bioloskog pola. Taj pomeraj nije slucajan. Sistem civilne evidencije ga koristi za administrativna pretrazivanja. GDPR clan 9 pokriva podatke koji otkrivaju licne karakteristike. Pol je jedna od njih. Stav UOOU: svaki dokument sa rodnim cislom nosi podatke bliske posebnoj kategoriji. Vazi jaca zastita.
Kako funkcionise kontrolna vrednost: Za 10-znakove brojeve (izdati posle 1954.), cela 9-znakova osnova mora biti deljiva sa 11. Za 9-znakove brojeve (izdati pre 1954.), ne postoji kontrolna vrednost. Alati moraju obradivati oba.
Sta UOOU smatra adekvatnom detekcijom
Tehnicke smernice UOOU iz 2024. za PII alate postavljaju tri zahteva.
Rukovanje pomerajem pola: Brojevi sa vrednostima meseca 51-62 su vazeci identifikatori za zene. Alat koji te vrednosti tretira kao nevazece datume propusta otprilike polovinu primarnog ID-ja odrasle zenske populacije.
Varijante formata: Rodjenja pre 1954. daju 9-znakove brojeve bez kontrolne vrednosti. Rodjenja posle 1954. daju 10-znakove brojeve sa jednom. Oba moraju biti podrzana.
Kontekstualni signali: U dokumentima na maticnom jeziku, identifikator se pojavljuje u blizini oznaka poput "Rodne cislo:", "RC:" ili "r.c.:". NER svestan jezika pomaze u pronalazenju ovih signala cak i u slobodnom tekstu.
Problem maticnih kompanija iz Nemacke
67% firmi u zemlji primenjuje PII alate konfigurisane za nemacke ili engleske identifikatore. UOOU je ovo otkrio u anketi. Lanac gresaka u proizvodnji je predvidljiv.
Nemacka maticna kompanija primenjuje alat za skeniranje. Podesен je za nemacke identifikatore. HR podaci - ugovori, zdravstveni zapisi, platni spiskovi - sadrze maticne brojeve. Alat nema logiku za ovaj tip identifikatora. Svaki maticni broj se propusta. Zdravstveni i podaci o plati zaposlenih krecu se bez kontrola koje UOOU zahteva. U slucaju revizije ili prekrsaja, lokalna firma ne moze pokazati "odgovarajuce tehnicke mere" prema GDPR clanu 32.
UOOU drzi lokalnog kontrolora odgovornim. "Nasu maticnu kompaniju je izabrala alat" nije valjana odbrana. GDPR pravilo o odgovornosti to ne dozvoljava.
Spisak za uskladjenost za proizvodne firme
Ove kontrole se primenjuju na industrijske firme sa alatima nemacke maticne kompanije.
- Detekcija maticnog broja: Formati od 9 i 10 znakova. Rukovanje mesecom sa pomerajem pola (50+). Modulus-11 kontrolna vrednost za 10-znakove varijante.
- NER na maticnom jeziku: spaCy
cs_core_newsili ekvivalentni model. Genericki alati pokazuju 23% nizu tacnost NER-a za ovaj jezik. Lokalni modeli zatvaraju tu prazninu. - Detekcija cisla OP: Gradjanská prukaz (nacionalna licna karta) je 9-znakovni broj. Pojavljuje se uz maticni broj u mnogim tipovima dokumenata.
- ICO i DIC: Poslovni ID i poreski brojevi pojavljuju se u ugovorima. Oba zahtevaju pokrivenost.
- Visejezicni cevovod: Mesovita okruzenja imaju dokumente na maticnom jeziku, nemackom i engleskom. Jednojezicni cevovod propusta medjujezicko kopojavljivanje.
Primena UOOU je dosledna. Firme koje pokazu tehnicke dokaze u reviziji suocavaju se sa mnogo nizim kaznama. Firme koje to ne mogu pokazati imaju visu izlozenost.
Za siri prikaz nacina na koji nacionalni ID-jevi stvaraju GDPR izlozenost, pogledajte nas vodic za detekciju EU nacionalnih poreskih ID-jeva.
Za slican nordijski identifikator, pogledajte nas Datatilsynet CPR tehnicki vodic.