ANSPDCP România: Detectarea CNP și Verificările GDPR
Actualizat pentru 2026
Autoritatea română de protecție a datelor este ANSPDCP. Evaluarea sa din 2024 a constatat că 78% dintre instrumentele PII nu reușesc să detecteze Codul Numeric Personal (CNP). Cele mai multe omit etapa de verificare a sumei de control. Această lacună creează un risc real de conformitate. România procesează date UE pentru numeroși clienți din Europa de Vest. Expunerea este extinsă.
Cel Mai Bogat în Date Identificator Național al României
CNP este un identificator național de 13 cifre. Fiecare grup de cifre conține date personale:
- Cifra 1: Codul de gen și secol. Bărbat născut 1900–1999 = 1. Femeie născută 1900–1999 = 2. Bărbat născut după 2000 = 5. Femeie născută după 2000 = 6. Rezident străin bărbat = 7. Rezident străin femeie = 8. Alt rezident = 9.
- Cifrele 2–3: Ultimele două cifre ale anului de naștere.
- Cifrele 4–5: Luna de naștere (01–12).
- Cifrele 6–7: Ziua de naștere (01–31).
- Cifrele 8–9: Codul județului. Acoperă 41 de județe și cele șase sectoare ale Bucureștiului (coduri 01–52).
- Cifrele 10–12: Ordinea la naștere în ziua și județul respectiv.
- Cifra 13: Cifra de control.
Cifra 1 singură dezvăluie sexul biologic. Conform articolului 9 din GDPR, aceasta face din acest număr un element de date din categorie specială. Necesită o protecție mai puternică decât datele personale obișnuite.
Cum funcționează cifra de control: Se iau primele 12 cifre. Fiecare se înmulțește cu coeficientul corespunzător (2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9). Se adună rezultatele. Se împarte la 11 și se reține restul. Un rest de 10 dă cifra de control 1. Un rest de 11 înseamnă că numărul nu este valid. Orice alt rest reprezintă cifra de control.
Instrumentele care sar peste acest test au două moduri de eșec. În primul rând, orice șir de 13 cifre este marcat ca potrivire (fals pozitiv). În al doilea rând, un număr corupt trece verificarea șablonului, dar conține date eronate. Acele date necesită revizuire și sunt omise (fals negativ).
Probleme NER în Documentele în Limba Română
Identificarea identificatorilor este doar o parte din activitate. Textul românesc adaugă mai multe obstacole de detectare.
Diacritice: Româna folosește ș, ț, ă, â și î. Instrumentele antrenate pe alte limbi omit adesea numele cu aceste litere. Documentele vechi în codificare Latin-2 generează și mai multe erori.
Formate de adresă: Tipurile de stradă folosesc forme prescurtate — Str., Bd., Al., Cal. Denumirile de orașe și comune urmează reguli locale. Analizatoarele construite pentru adrese franceze sau germane funcționează slab în acest context.
Flexiunea numelor: Numele se modifică după caz gramatical în română. Același nume de persoană arată diferit în diferite părți ale unui document. Modelele NER trebuie să gestioneze acest lucru pentru a lega numele din întregul document.
Consultați ghidul nostru de detectare PII APAC pentru efectele lacunelor lingvistice asupra detectării în scripturi non-occidentale.
Cum Evoluează Cazurile ANSPDCP
Cazurile ANSPDCP urmează trei tipare.
Cazuri de breșe BPO: Fișierele partajate conțin numere de identificare ale angajaților și date de clienți UE fără criptare. Jurnalele insuficiente fac imposibil pentru firmă să determine ce înregistrări au fost accesate, ceea ce prelungește investigația și mărește amenda.
Expuneri medicale: Fișierele de pacienți — CNP, ID-ul cardului de sănătate și diagnosticul — ajung la persoana greșită. Instrumentul PII nu suporta acest format. Datele au ieșit fără mascare.
Eșecuri la transferuri transfrontaliere: O firmă de externalizare trimite înregistrări legate de identificatori către o parte din afara SEE. Fără Evaluarea Impactului Transferului. Fără Clauze Contractuale Standard. Statutul de articol 9 al datelor transformă o lacună de rutină într-o încălcare mai gravă.
Trei Controale pentru Conformitatea ANSPDCP
Acestea trei formează baza tehnică minimă:
- Detectarea CNP cu validare modulo-11 — potrivirea de șabloane nu este suficientă.
- NER cu suport pentru diacritice — acoperiți ș, ț, ă, â și î atât din surse UTF-8, cât și Latin-2.
- Detectarea actului de identitate — cartea de identitate națională apare alături de CNP în multe tipuri de documente.
Pentru o perspectivă mai largă asupra riscului GDPR generat de ID-urile naționale, consultați ghidul nostru de detectare a CNP-urilor fiscale naționale din UE.