Tilbage til BlogGDPR & Overholdelse

ANSPDCP og Rumænsk GDPR: Hvorfor CNP-detektion med checksum-validering er uforhandlingsbar

ANSPDCP fandt, at 78% af værktøjerne ikke registrerer rumænsk CNP med korrekt validering. CNP koder for køn, fødselsdato og fødselsamt — GDPR-specifikke kategoriimplikationer. Rumænsk sprog NER til GDPR-kompatibel behandling.

March 7, 20267 min læsning
Romania ANSPDCPCNP checksum validationRomanian GDPRBPO complianceRomanian identifiers

Rumæniens Autoritatea Națională de Supraveghere a Prelucrării Datelor cu Caracter Personal (ANSPDCP) offentliggjorde en teknisk vurdering for 2024 med en bemærkelsesværdig opdagelse: 78% af PII-værktøjerne, der anvendes i rumænske outsourcing-operationer, fejler i at registrere Cod Numeric Personal (CNP) med korrekt checksum-validering. For et land, der behandler EU-borgerdata i stor skala for vestlige europæiske kunder, skaber dette systemisk overholdelseseksponering.

CNP: Rumæniens Rigeste Personlige Identifikator

CNP er et 13-cifret nationalt identifikationsnummer:

  • Ciffer 1: Køn og århundredekode (1=mand 1900-1999, 2=kvinde 1900-1999, 5=mand 2000+, 6=kvinde 2000+, 7=mand udenlandsk bosiddende, 8=kvinde udenlandsk bosiddende, 9=anden bosiddende)
  • Ciffer 2-3: Sidste to cifre af fødselsåret
  • Ciffer 4-5: Fødselsmåned (01-12)
  • Ciffer 6-7: Fødselsdag (01-31)
  • Ciffer 8-9: Amtskode (01-52, svarende til Rumæniens 41 amter + Bukarest-sektorer)
  • Ciffer 10-12: Sekventielt fødselsnummer inden for dag og amt
  • Ciffer 13: Checkciffer (vægtet sum modulus 11)

CNP koder for køn, fødselsdato (komplet), fødselsamt og statsborgerskabsstatus — hvilket gør det til en af Europas mest informationsrige nationale identifikatorer. Kode for køn i ciffer 1 gør CNP til en de facto indikator for specialkategori i henhold til GDPR Artikel 9 (afslører biologisk køn), hvilket kræver øget beskyttelse.

Checksum-validering: Checkciffer-algoritmen multiplicerer de første 12 cifre med vægte (2,7,9,1,4,6,3,5,8,2,7,9), summerer produkterne, tager modulo 11. Hvis resultatet er 10, er checkcifferen 1. Hvis resultatet er 11, er CNP ugyldig. Ellers er checkcifferen lig med resultatet.

78% af værktøjerne overser denne validering — hvilket genererer både falske positive (enhver 13-cifret nummer bliver flaget) og falske negative (korrupt CNP-numre passerer mønster match, men fejler checksums og bliver derfor overset som potentielt ugyldige data, der kræver gennemgang).

Rumænsk Sprog NER: Det Manglende Lag

Udover CNP skaber rumænsk sprogbehandling specifikke NER-udfordringer:

Rumænske diakritiske tegn: Rumænsk bruger tegnene ș (s-cedilla), ț (t-cedilla), ă, â, og î. Værktøjer trænet på ikke-rumænsk tekst kan fejle i at genkende rumænske navne, der indeholder disse tegn. Kodeproblemer (UTF-8 vs. Latin-2) i ældre rumænske dokumenter skaber yderligere detektionsudfordringer.

Rumænske adresseformater: "Strada" (forkortet "Str."), "Bulevardul" (forkortet "Bd."), "Aleea" (forkortet "Al."), "Calea" (forkortet "Cal.") for gade typer. Rumænske lokaliteter inkluderer både byer (municipii) og kommuner (comune) med navngivningskonventioner, der adskiller sig fra vestlige europæiske adresseformater.

Rumænske navnemønstre: Rumænske navne følger specifikke patronymiske og grammatiske konventioner. Det samme navn vises i forskellige grammatiske tilfælde afhængigt af dets grammatiske rolle i sætningen (nominativ, genitiv-dativ). NER-modeller skal håndtere kasusvariation for korrekt at identificere rumænske navne på tværs af dokumentkontekster.

ANSPDCP's Håndhævelsesmønster

ANSPDCP's håndhævelsessager følger et konsekvent mønster, der afslører de specifikke tekniske fejl, der fører til overtrædelser:

BPO databrudssager: Callcenter- eller IT-supportorganisationer lider et databrud. Undersøgelsen afslører, at delte filer, der indeholder rumænske medarbejder CNP-numre og EU-kunde personlige data, blev opbevaret uden tilstrækkelig kryptering. Vurderingen af brudets omfang hæmmes af utilstrækkelig logning — organisationen kan ikke bestemme præcist, hvilke optegnelser der blev tilgået.

Sundhedsdataeksponering: Patientoptegnelser, der indeholder CNP-numre, sundhedskortnumre og diagnoseoplysninger, deles utilsigtet med uautoriserede parter (emailet til forkert modtager, postet til forkert cloud-mappe). CNP-numrene blev ikke registreret eller pseudonymiseret før deling, fordi organisationens PII-værktøj ikke inkluderede rumænsk identifikatorstøtte.

Grænseoverskridende overførsel uden sikkerhedsforanstaltninger: Rumænsk BPO-organisation overfører EU-kundedata (herunder CNP-relaterede optegnelser) til indisk underbehandler til dataindtastning eller behandling, uden tilstrækkelig Transfer Impact Assessment og Standard Contractual Clauses. CNP-numre i overførte filer skaber GDPR-specialkategori overførselseksponering.

For rumænsk GDPR-overholdelse: CNP-detektion med modulo-11 checksum-validering, rumænsk sprog NER med diakritisk opmærksom behandling, og rumænsk national ID-kortdetektion er den tekniske baseline, som ANSPDCP's håndhævelsesoptegnelse viser er nødvendig.

Kilder:

Klar til at beskytte dine data?

Begynd at anonymisere PII med 285+ enhedstyper på tværs af 48 sprog.