Aggiornato al 2026

L'autorità rumena per la protezione dei dati è l'ANSPDCP. La sua valutazione del 2024 ha rilevato che il 78% degli strumenti PII non riesce a rilevare il Cod Numeric Personal (CNP), nella maggior parte dei casi saltando il passaggio di verifica del checksum. Questa lacuna genera un rischio di conformità reale: la Romania tratta dati UE per numerosi clienti occidentali, con un'esposizione molto ampia.

L'identificativo nazionale rumeno più ricco di dati

Il CNP è un identificativo nazionale a 13 cifre. Ogni gruppo di cifre contiene dati personali:

Cifra 1: Codice di sesso e secolo. Maschio nato tra il 1900 e il 1999 = 1. Femmina nata tra il 1900 e il 1999 = 2. Maschio nato dal 2000 in poi = 5. Femmina nata dal 2000 in poi = 6. Residente straniero maschio = 7. Residente straniera femmina = 8. Altro residente = 9.
Cifre 2–3: Ultime due cifre dell'anno di nascita.
Cifre 4–5: Mese di nascita (01–12).
Cifre 6–7: Giorno di nascita (01–31).
Cifre 8–9: Codice di contea. Copre 41 contee e i sei settori di Bucarest (codici 01–52).
Cifre 10–12: Ordine di nascita nel giorno e nella contea di riferimento.
Cifra 13: Cifra di controllo.

La sola cifra 1 rivela il sesso biologico. Ai sensi dell'Articolo 9 del GDPR, questo rende il CNP un dato di categoria speciale, che richiede una protezione più elevata rispetto ai dati personali ordinari.

Come funziona la cifra di controllo: Si prendono le prime 12 cifre e si moltiplica ciascuna per il rispettivo peso (2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9). Si sommano i risultati e si divide per 11, prendendo il resto. Un resto di 10 dà cifra di controllo 1; un resto di 11 indica un codice non valido; qualsiasi altro resto corrisponde alla cifra di controllo.

Gli strumenti che saltano questo test presentano due modalità di errore. Prima: qualsiasi stringa di 13 cifre viene segnalata come corrispondenza (falsi positivi). Seconda: un numero corrotto supera il controllo del pattern pur contenendo dati errati — questi dati richiedono revisione ma vengono ignorati (falsi negativi).

Problemi di NER nei documenti in lingua rumena

Il rilevamento degli identificativi è solo una parte del lavoro. I testi in rumeno aggiungono ulteriori difficoltà al rilevamento.

Diacritici: Il rumeno utilizza ș, ț, ă, â e î. Gli strumenti addestrati su altre lingue spesso non riconoscono i nomi contenenti queste lettere. I documenti più datati in codifica Latin-2 generano ulteriori errori.

Formati degli indirizzi: I tipi di via utilizzano forme abbreviate — Str., Bd., Al., Cal. I nomi di città e comuni seguono convenzioni locali. I parser progettati per indirizzi francesi o tedeschi ottengono risultati scadenti.

Flessione dei nomi: In rumeno, i nomi cambiano forma in base al caso grammaticale. Lo stesso nome appare in forme diverse all'interno del documento. I modelli NER devono gestire questa variabilità per collegare correttamente i nomi tra le diverse parti del testo.

Consulta la nostra guida al rilevamento PII in area APAC per comprendere come le lacune linguistiche influiscano sul rilevamento in alfabeti non occidentali.

Come si sviluppano i casi ANSPDCP

I casi ANSPDCP mostrano tre tipologie ricorrenti.

Violazioni nei BPO: File condivisi contenenti numeri identificativi dei dipendenti e dati di clienti UE, privi di cifratura. Log insufficienti impediscono di stabilire a quali record si sia avuto accesso, prolungando l'indagine e aumentando le sanzioni.

Esposizione sanitaria: Cartelle cliniche — con codice identificativo nazionale, tessera sanitaria e diagnosi — raggiungono persone non autorizzate. Lo strumento PII non supportava questo formato e i dati sono stati trasmessi senza mascheramento.

Mancati requisiti per i trasferimenti transfrontalieri: Una società di outsourcing invia record collegati agli identificativi a un soggetto extra-SEE, senza Transfer Impact Assessment né Clausole Contrattuali Standard. Lo status del dato ai sensi dell'Articolo 9 trasforma una lacuna ordinaria in una violazione più grave.

Tre misure di controllo per la conformità all'ANSPDCP

Queste tre misure costituiscono il requisito tecnico minimo:

Rilevamento del CNP con validazione modulo 11 — il solo pattern matching non è sufficiente.
NER con supporto dei diacritici — copertura di ș, ț, ă, â e î sia in sorgenti UTF-8 che Latin-2.
Rilevamento della carta d'identità — il documento nazionale compare accanto al CNP in molte tipologie documentali.

Per una visione più ampia del rischio GDPR creato dagli identificativi nazionali, consulta la nostra guida al rilevamento dei codici fiscali nazionali UE.

Fonti

Pronto a proteggere i tuoi dati?

Inizia ad anonimizzare i PII con oltre 285 tipi di entità in 48 lingue.

Inizia Prova Gratuita Visualizza Funzionalità

ANSPDCP Romania: Rilevamento e Validazione del CNP

L'identificativo nazionale rumeno più ricco di dati

Problemi di NER nei documenti in lingua rumena

Come si sviluppano i casi ANSPDCP

Tre misure di controllo per la conformità all'ANSPDCP

Fonti

Articoli Correlati

I Tool PII Self-Hosted Falliscono gli Audit di Conformità

Presidio Non Rileva 220+ Entità GDPR

Configuration Drift: un Rischio GDPR Nascosto

Pronto a proteggere i tuoi dati?

ANSPDCP Romania: Rilevamento e Validazione del CNP

ANSPDCP Romania: Rilevamento del CNP e verifiche GDPR

L'identificativo nazionale rumeno più ricco di dati

Problemi di NER nei documenti in lingua rumena

Come si sviluppano i casi ANSPDCP

Tre misure di controllo per la conformità all'ANSPDCP

Fonti

Articoli Correlati

I Tool PII Self-Hosted Falliscono gli Audit di Conformità

Presidio Non Rileva 220+ Entità GDPR

Configuration Drift: un Rischio GDPR Nascosto

Pronto a proteggere i tuoi dati?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow