ANSPDCP Romania: Deteccio del CNP i Verificacions del RGPD
Actualitzat per al 2026
L'organisme de dades de Romania es l'ANSPDCP. La seva avaluacio del 2024 va constatar que el 78% de les eines d'IPI fallen en la deteccio del Cod Numeric Personal (CNP). La majoria ometen el pas de la suma de control. Aquesta deficiencia crea un risc de compliment real. Romania processa dades de la UE per a molts clients occidentals. L'exposicio es amplia.
L'Identificador Nacional amb Mes Dades de Romania
El CNP es un identificador nacional de 13 digits. Cada grup de digits conte dades personals:
- Digit 1: Codi de genere i segle. Home nascut entre 1900 i 1999 = 1. Dona nascuda entre 1900 i 1999 = 2. Home nascut a partir del 2000 = 5. Dona nascuda a partir del 2000 = 6. Resident estranger home = 7. Residente estrangera dona = 8. Altres residents = 9.
- Digits 2-3: Dos ultims digits de l'any de naixement.
- Digits 4-5: Mes de naixement (01-12).
- Digits 6-7: Dia de naixement (01-31).
- Digits 8-9: Codi de comtat. Abasta 41 comtats i els sis sectors de Bucarest (codis 01-52).
- Digits 10-12: Ordre de naixement dins d'aquell dia i comtat.
- Digit 13: Digit de verificacio.
Nomes el digit 1 revela el sexe biologic. Segons l'Article 9 del RGPD, aixo converteix aquest numero en un element de dades de categoria especial. Necessita una proteccio mes solida que les dades personals ordinaries.
Com funciona el digit de verificacio: Es prenen els primers 12 digits. Cada un es multiplica pel seu pes (2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9). S'agreguen els resultats. Es divideix per 11 i es pren el residu. Un residu de 10 dona el digit de verificacio 1. Un residu d'11 significa que el codi no es valid. Qualsevol altre residu es el digit de verificacio.
Les eines que ometen aquesta prova tenen dos modes de fallada. Primer, qualsevol cadena de 13 digits es marca com a coincidencia (falsos positius). Segon, un numero corromput supera la comprovacio del patro pero conte dades incorrectes. Aquestes dades necessiten revisio i no es detecten (falsos negatius).
Problemes de NER en Documents en Romanes
Trobar identificadors es nomes una part de la feina. El text romanes afegeix mes obstacles a la deteccio.
Diacritics: El romanes utilitza s, t, a, a i i amb diacritics. Les eines entrenades en altres idiomes sovint perden noms amb aquestes lletres. Els documents antics en codificacio Latin-2 afegeixen mes fallades.
Formats d'adreca: Els tipus de carrer utilitzen formes curtes: Str., Bd., Al., Cal. Els noms de ciutats i municipis segueixen normes locals. Els analitzadors construits per a adreces franceses o alemanyes ho fan malament aqui.
Inflexio dels noms: Els noms canvien de forma per cas gramatical en romanes. El nom de la mateixa persona te un aspecte diferent en diferents parts d'una frase. Els models NER han de gestionar aixo per vincular noms en un document.
Vegeu la nostra guia de deteccio d'IPI de l'APAC per veure com els buits linguistics afecten la deteccio en escriptures no occidentals.
Com Es Desenvolupen els Casos de l'ANSPDCP
Els casos de l'ANSPDCP mostren tres patrons.
Casos de violacio del BPO: Els arxius compartits contenen numeros d'identitat d'empleats i dades de clients de la UE sense xifratge. Els registres deficients signifiquen que l'empresa no pot determinar a quins registres s'ha accedit. Aixo allarga la investigacio i augmenta la multa.
Exposicio sanitaria: Els arxius de pacients, que inclouen el numero d'identitat nacional, el codi de la targeta sanitaria i el diagnostic, arriben a la persona incorrecta. L'eina d'IPI no tenia compatibilitat amb aquest format. Les dades van sortir sense anonimitzar.
Fallades en transferencies transfrontereres: Una empresa d'externalitzacio envia registres vinculats a identificadors a una part fora de l'EEE. Sense Avaluacio d'Impacte de la Transferencia. Sense Clausules Contractuals Estandard. L'estatus de l'Article 9 de les dades converteix una llacuna rutinaria en una infraccio mes greu.
Tres Controls per al Compliment de l'ANSPDCP
Aquests tres formen la referencia tecnica minima:
- Deteccio del CNP amb validacio modul 11: la concordanca de patrons sola no es suficient.
- NER sensible als diacritics: cal cobrir s, t, a, a i i tant en fonts UTF-8 com Latin-2.
- Deteccio del document d'identitat: el document nacional apareix juntament amb el CNP en molts tipus de documents.
Per a una visio mes amplia de com els DNI nacionals creen risc en el RGPD, vegeu la nostra guia de deteccio de DNI fiscals nacionals de la UE.