ANSPDCP Romania: Rilevamento del CNP e verifiche GDPR
Aggiornato al 2026
L'autorità rumena per la protezione dei dati è l'ANSPDCP. La sua valutazione del 2024 ha rilevato che il 78% degli strumenti PII non riesce a rilevare il Cod Numeric Personal (CNP), nella maggior parte dei casi saltando il passaggio di verifica del checksum. Questa lacuna genera un rischio di conformità reale: la Romania tratta dati UE per numerosi clienti occidentali, con un'esposizione molto ampia.
L'identificativo nazionale rumeno più ricco di dati
Il CNP è un identificativo nazionale a 13 cifre. Ogni gruppo di cifre contiene dati personali:
- Cifra 1: Codice di sesso e secolo. Maschio nato tra il 1900 e il 1999 = 1. Femmina nata tra il 1900 e il 1999 = 2. Maschio nato dal 2000 in poi = 5. Femmina nata dal 2000 in poi = 6. Residente straniero maschio = 7. Residente straniera femmina = 8. Altro residente = 9.
- Cifre 2–3: Ultime due cifre dell'anno di nascita.
- Cifre 4–5: Mese di nascita (01–12).
- Cifre 6–7: Giorno di nascita (01–31).
- Cifre 8–9: Codice di contea. Copre 41 contee e i sei settori di Bucarest (codici 01–52).
- Cifre 10–12: Ordine di nascita nel giorno e nella contea di riferimento.
- Cifra 13: Cifra di controllo.
La sola cifra 1 rivela il sesso biologico. Ai sensi dell'Articolo 9 del GDPR, questo rende il CNP un dato di categoria speciale, che richiede una protezione più elevata rispetto ai dati personali ordinari.
Come funziona la cifra di controllo: Si prendono le prime 12 cifre e si moltiplica ciascuna per il rispettivo peso (2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9). Si sommano i risultati e si divide per 11, prendendo il resto. Un resto di 10 dà cifra di controllo 1; un resto di 11 indica un codice non valido; qualsiasi altro resto corrisponde alla cifra di controllo.
Gli strumenti che saltano questo test presentano due modalità di errore. Prima: qualsiasi stringa di 13 cifre viene segnalata come corrispondenza (falsi positivi). Seconda: un numero corrotto supera il controllo del pattern pur contenendo dati errati — questi dati richiedono revisione ma vengono ignorati (falsi negativi).
Problemi di NER nei documenti in lingua rumena
Il rilevamento degli identificativi è solo una parte del lavoro. I testi in rumeno aggiungono ulteriori difficoltà al rilevamento.
Diacritici: Il rumeno utilizza ș, ț, ă, â e î. Gli strumenti addestrati su altre lingue spesso non riconoscono i nomi contenenti queste lettere. I documenti più datati in codifica Latin-2 generano ulteriori errori.
Formati degli indirizzi: I tipi di via utilizzano forme abbreviate — Str., Bd., Al., Cal. I nomi di città e comuni seguono convenzioni locali. I parser progettati per indirizzi francesi o tedeschi ottengono risultati scadenti.
Flessione dei nomi: In rumeno, i nomi cambiano forma in base al caso grammaticale. Lo stesso nome appare in forme diverse all'interno del documento. I modelli NER devono gestire questa variabilità per collegare correttamente i nomi tra le diverse parti del testo.
Consulta la nostra guida al rilevamento PII in area APAC per comprendere come le lacune linguistiche influiscano sul rilevamento in alfabeti non occidentali.
Come si sviluppano i casi ANSPDCP
I casi ANSPDCP mostrano tre tipologie ricorrenti.
Violazioni nei BPO: File condivisi contenenti numeri identificativi dei dipendenti e dati di clienti UE, privi di cifratura. Log insufficienti impediscono di stabilire a quali record si sia avuto accesso, prolungando l'indagine e aumentando le sanzioni.
Esposizione sanitaria: Cartelle cliniche — con codice identificativo nazionale, tessera sanitaria e diagnosi — raggiungono persone non autorizzate. Lo strumento PII non supportava questo formato e i dati sono stati trasmessi senza mascheramento.
Mancati requisiti per i trasferimenti transfrontalieri: Una società di outsourcing invia record collegati agli identificativi a un soggetto extra-SEE, senza Transfer Impact Assessment né Clausole Contrattuali Standard. Lo status del dato ai sensi dell'Articolo 9 trasforma una lacuna ordinaria in una violazione più grave.
Tre misure di controllo per la conformità all'ANSPDCP
Queste tre misure costituiscono il requisito tecnico minimo:
- Rilevamento del CNP con validazione modulo 11 — il solo pattern matching non è sufficiente.
- NER con supporto dei diacritici — copertura di ș, ț, ă, â e î sia in sorgenti UTF-8 che Latin-2.
- Rilevamento della carta d'identità — il documento nazionale compare accanto al CNP in molte tipologie documentali.
Per una visione più ampia del rischio GDPR creato dagli identificativi nazionali, consulta la nostra guida al rilevamento dei codici fiscali nazionali UE.