Rumunský Codul Numeric Personal (CNP) je více než pouhé ID číslo — kóduje pohlaví, datum a kraj narození do 13místné struktury. Tato bohatost informací dělá CNP strukturálně ekvivalentní zvláštní kategorii dat pod GDPR, i když rumunský zákon takto výslovně neklasifikuje CNP.
Struktura a GDPR dopad CNP
CNP formát: S YY MM DD CC NNN C
- S (1 číslice): pohlaví a staletí — 1-2 pro narozené 1900-1999, 3-4 pro narozené 1800-1899, 5-6 pro narozené 2000+, 7-9 pro cizince
- YY (2 číslice): rok narození
- MM (2 číslice): měsíc narození
- DD (2 číslice): den narození
- CC (2 číslice): kód kraje — 01-46 pro rumunské kraje, 51-52 pro Bukurešť
- NNN (3 číslice): sekvenční číslo v rámci dne/kraje/pohlaví skupiny
- C (1 číslice): kontrolní číslice (vážený součet)
ANSPDCP pozice: CNP kombinuje pohlaví, datum a místo — což jsou atributy, jejichž kombinace vytváří vysoké riziko re-identifikace. Konkrétně pohlaví je zvláštní kategorií dat pod Článkem 9 GDPR. CNP je proto strukturálně zvláštní kategorii ekvivalentním datovým typem.
Implementace Validace Kontrolní Číslice
Kontrolní číslice CNP používá váhovaný součet algoritmus:
- Násobte číslice 1-12 váhami: 2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9
- Sečtěte součiny
- Vydělte součet 11
- Zbytek 0 nebo 1 → kontrolní číslice je 1; jinak kontrolní číslice = zbytek
Nástroj detekující CNP bez implementace tohoto algoritmu validace kontrolní číslice bude:
- Generovat vysoké míry falešně pozitivní (13místná čísla, která nejsou platným CNP)
- Přehlídat platný CNP s nestandardním formátováním
- Selhávat při validaci CNP pro zahraniční rezidenty (S = 7-9 kategorie)
Výsledky auditu ANSPDCP: 78 % přehlíží CNP
Technické audity ANSPDCP v roce 2024 nasazených nástrojů PII zjistily:
- 78 % nástrojů přehlíží CNP bez řádné validace kontrolní číslice
- 34 % nástrojů nesprávně klasifikuje CNP jako bezvýznamné číslo (bez kontextového povědomí)
- 15 % nástrojů detekuje CNP ale selhává při identifikaci starodávných formátů (S = 3-4 pro 1800-1899 narozené)
Rumunský jazykový kontext
Rumunská NER je pro PII detekci kritická:
- Jména v rumunském skloňování: Rumunská jména procházejí flexí (Ionescu vs. Ionescului vs. Ionescuiui) — nástroje trénované na anglickém jmenném rozpoznání přehlíží skloněné formy
- Adresní formáty: Rumunský PSČ (6místný, žádná mezera), název ulice (Strada, Bulevardul, Piața)
- Obchodní identifikátory: CIF (Cod de Identificare Fiscală) pro rumunské subjekty
Zdroje: