ÚOOÚ и Родното Число: Кодирање на полот под GDPR
Ажурирано за 2026 година
Чешкиот орган за заштита на податоци е ÚOOÚ. Во полна форма: Úřad pro ochranu osobních údajů. Издал 58 пресуди во 2024 година. Еден наод се јавува во многу случаи. Родното число (број на раѓање) е обработувано без откривање. Употребената алатка за ЛП е изградена за германски или англиски јазик. Немала логика за овој тип идентификатор. ÚOOÚ е јасен: алатките мора да го откријат родното число со валидација на контролната сума и правилно ракување со отклонот за пол.
Родно Число: Податок со специјална категорија по структура
Родното число, или RČ, го користи форматот RRMMDD/XXXX.
- RR — последните две цифри од годината на раѓање.
- MM — месец на раѓање. За жени, се додаваат 50. Месец 01 станува 51. Месец 12 станува 62.
- DD — ден на раѓање.
- XXXX — краток редослед од 3–4 цифри плус контролна вредност (по модул 11).
Отклонот на месецот за жени го прави овој број показател за биолошкиот пол. Тој отклон не е случаен. Системот за граѓанска регистрација го користи за административно пребарување. Член 9 на GDPR ги покрива податоците кои ги откриваат личните карактеристики. Полот е еден од нив. Став на ÚOOÚ: секој документ со родно число носи податоци блиски до специјалната категорија. Се применува посилна заштита.
Kako функционира контролната вредност: За 10-знаковни броеви (издадени после 1954 година), целата 9-знаковна основа мора рамномерно да се дели со 11. За 9-знаковни броеви (издадени пред 1954 година), не постои контролна вредност. Алатките мора да ги обработуваат и двете.
Она Што ÚOOÚ го Смета за Адекватно Откривање
Техничкото упатство на ÚOOÚ за 2024 година за алатки за ЛП поставува три барања.
Ракување со отклонот за пол: Броеви со вредности на месецот 51–62 се важечки идентификатори за жени. Алатка која ги третира тие вредности како неважечки датуми пропушта приближно половина од примарниот идентификатор на возрасното женско население.
Варијанти на форматот: Раѓањата пред 1954 година даваат 9-знаковни броеви без контролна вредност. Раѓањата после 1954 година даваат 10-знаковни броеви со контролна вредност. Мора да бидат поддржани и двете.
Контекстуални сигнали: Во документи на мајчиниот јазик, идентификаторот се јавува близу ознаки како "Rodné číslo:", "RČ:" или "r.č.:". Јазично свесниот NER помага во наоѓање на овие сигнали дури и во слободен текст.
Проблемот со Германската Матична Компанија
67% од фирмите во земјата распоредуваат алатки за ЛП конфигурирани за германски или англиски јазик. ÚOOÚ го утврди ова во истражување. Синџирот на неуспех во производството е предвидлив.
Германска матична компанија распоредува алатка за скенирање. Таа е поставена за германски идентификатори. Податоците за ЧР — договори, здравствени записи, плата — содржат броеви на раѓање. Алатката нема логика за овој тип идентификатор. Секој број на раѓање е пропуштен. Здравствените и платните податоци на вработените се движат без контролите кои ÚOOÚ ги бара. При ревизија или прекршување, локалната фирма не може да покаже "соодветни технички мерки" по член 32 на GDPR.
ÚOOÚ го смета локалниот контролор за одговорен. "Нашата матична компанија ја избрала алатката" не е важечка одбрана. Правилото за одговорност на GDPR не го дозволува тоа.
Листа за Проверка на Усогласеноста за Производствени Фирми
Овие контроли се применуваат на индустриски фирми со алатки на германска матична компанија.
- Откривање на број на раѓање: И 9-знаковни и 10-знаковни формати. Ракување со отклонот на месецот за жени (50+). Контролна вредност по модул 11 за 10-знаковни варијанти.
- NER на мајчиниот јазик: spaCy
cs_core_newsили еквивалентен модел. Генеричките алатки покажуваат 23% пониска точност на NER за овој јазик. Локалните модели го затвораат јазот. - Откривање на číslo OP: Граѓанската лична карта (občanský průkaz) е 9-знаковен број. Се јавува заедно со бројот на раѓање во многу типови документи.
- IČO и DIČ: Деловниот идентификатор и даночниот број се јавуваат во договорите. И на двата им е потребна покриеност.
- Повеќејазичен процесирачки ланец: Мешаните средини имаат документи на мајчиниот јазик, германски и англиски. Еднојазичен процесирачки ланец пропушта меѓујазично соодветствување.
Спроведувањето на ÚOOÚ е конзистентно. Фирмите кои покажуваат технички докази при ревизија се соочуваат со многу пониски глоби. Фирмите кои не можат да го покажат тоа се соочуваат со поголема изложеност.