Zpět na blogGDPR a shoda

ANSPDCP a rumunský GDPR: Proč detekce CNP s validací...

ANSPDCP zjistila, že 78 % nástrojů přehlíží rumunské CNP s řádnou validací. CNP kóduje pohlaví, datum a kraj narození...

April 21, 20267 min čtení
Romania ANSPDCPCNP checksum validationRomanian GDPRBPO complianceRomanian identifiers

Rumunský Codul Numeric Personal (CNP) je více než pouhé ID číslo — kóduje pohlaví, datum a kraj narození do 13místné struktury. Tato bohatost informací dělá CNP strukturálně ekvivalentní zvláštní kategorii dat pod GDPR, i když rumunský zákon takto výslovně neklasifikuje CNP.

Struktura a GDPR dopad CNP

CNP formát: S YY MM DD CC NNN C

  • S (1 číslice): pohlaví a staletí — 1-2 pro narozené 1900-1999, 3-4 pro narozené 1800-1899, 5-6 pro narozené 2000+, 7-9 pro cizince
  • YY (2 číslice): rok narození
  • MM (2 číslice): měsíc narození
  • DD (2 číslice): den narození
  • CC (2 číslice): kód kraje — 01-46 pro rumunské kraje, 51-52 pro Bukurešť
  • NNN (3 číslice): sekvenční číslo v rámci dne/kraje/pohlaví skupiny
  • C (1 číslice): kontrolní číslice (vážený součet)

ANSPDCP pozice: CNP kombinuje pohlaví, datum a místo — což jsou atributy, jejichž kombinace vytváří vysoké riziko re-identifikace. Konkrétně pohlaví je zvláštní kategorií dat pod Článkem 9 GDPR. CNP je proto strukturálně zvláštní kategorii ekvivalentním datovým typem.

Implementace Validace Kontrolní Číslice

Kontrolní číslice CNP používá váhovaný součet algoritmus:

  1. Násobte číslice 1-12 váhami: 2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9
  2. Sečtěte součiny
  3. Vydělte součet 11
  4. Zbytek 0 nebo 1 → kontrolní číslice je 1; jinak kontrolní číslice = zbytek

Nástroj detekující CNP bez implementace tohoto algoritmu validace kontrolní číslice bude:

  • Generovat vysoké míry falešně pozitivní (13místná čísla, která nejsou platným CNP)
  • Přehlídat platný CNP s nestandardním formátováním
  • Selhávat při validaci CNP pro zahraniční rezidenty (S = 7-9 kategorie)

Výsledky auditu ANSPDCP: 78 % přehlíží CNP

Technické audity ANSPDCP v roce 2024 nasazených nástrojů PII zjistily:

  • 78 % nástrojů přehlíží CNP bez řádné validace kontrolní číslice
  • 34 % nástrojů nesprávně klasifikuje CNP jako bezvýznamné číslo (bez kontextového povědomí)
  • 15 % nástrojů detekuje CNP ale selhává při identifikaci starodávných formátů (S = 3-4 pro 1800-1899 narozené)

Rumunský jazykový kontext

Rumunská NER je pro PII detekci kritická:

  • Jména v rumunském skloňování: Rumunská jména procházejí flexí (Ionescu vs. Ionescului vs. Ionescuiui) — nástroje trénované na anglickém jmenném rozpoznání přehlíží skloněné formy
  • Adresní formáty: Rumunský PSČ (6místný, žádná mezera), název ulice (Strada, Bulevardul, Piața)
  • Obchodní identifikátory: CIF (Cod de Identificare Fiscală) pro rumunské subjekty

Zdroje:

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.