Tilbake til BloggGDPR & Overholdelse

ANSPDCP og rumensk GDPR: Hvorfor CNP-detektering med sjekksumvalidering er uforhandlingsbar

ANSPDCP fant at 78 % av verktøyene ikke oppdager rumensk CNP med riktig validering. CNP koder kjønn, fødselsdato og fødselsfylke — GDPR spesielle kategoriimplikasjoner. Rumensk språk NER for GDPR-kompatibel behandling.

March 7, 20267 min lesing
Romania ANSPDCPCNP checksum validationRomanian GDPRBPO complianceRomanian identifiers

Rumens Autoritatea Națională de Supraveghere a Prelucrării Datelor cu Caracter Personal (ANSPDCP) publiserte en teknisk vurdering for 2024 med en slående oppdagelse: 78 % av PII-verktøyene som brukes i rumenske outsourcing-operasjoner klarer ikke å oppdage Cod Numeric Personal (CNP) med riktig sjekksumvalidering. For et land som behandler EU-borgerdata i stor skala for vest-europeiske kunder, skaper dette systemisk samsvarsrisiko.

CNP: Rumens rikeste personlige identifikator

CNP er et 13-sifret nasjonalt identifikasjonsnummer:

  • Siffer 1: Kjønn og århundre kode (1=mann 1900-1999, 2=kvinne 1900-1999, 5=mann 2000+, 6=kvinne 2000+, 7=mann utenlandsk bosatt, 8=kvinne utenlandsk bosatt, 9=annen bosatt)
  • Siffer 2-3: De to siste sifrene av fødselsåret
  • Siffer 4-5: Fødselsmåned (01-12)
  • Siffer 6-7: Fødselsdag (01-31)
  • Siffer 8-9: Fylkeskode (01-52, som tilsvarer Rumens 41 fylker + sektorer i București)
  • Siffer 10-12: Sekvensielt fødselsnummer innen dag og fylke
  • Siffer 13: Sjekksiffer (vektet sum modulus 11)

CNP koder kjønn, fødselsdato (fullstendig), fødselsfylke og statsborgerskapsstatus — noe som gjør det til en av Europas mest informasjonsrike nasjonale identifikatorer. Kjønnskodingen i siffer 1 gjør CNP til en de facto spesialkategoriindikator under GDPR Artikkel 9 (avslører biologisk kjønn), som krever økt beskyttelse.

Sjekksumvalidering: Sjekksifferalgoritmen multipliserer de første 12 sifrene med vekter (2,7,9,1,4,6,3,5,8,2,7,9), summerer produktene, tar modulo 11. Hvis resultatet er 10, er sjekksifferet 1. Hvis resultatet er 11, er CNP ugyldig. Ellers er sjekksifferet lik resultatet.

78 % av verktøyene overser denne valideringen — noe som genererer både falske positiver (hvilket som helst 13-sifret nummer blir flagget) og falske negativer (korrupte CNP-numre passerer mønstermatching, men feiler sjekksummer og blir derfor oversett som potensielt ugyldige data som krever gjennomgang).

Rumensk språk NER: Det manglende laget

Utover CNP skaper rumensk språkbehandling spesifikke NER-utfordringer:

Rumenske diakritiske tegn: Rumensk bruker tegnene ș (s-cedilla), ț (t-cedilla), ă, â, og î. Verktøy trent på ikke-rumensk tekst kan feile i å gjenkjenne rumenske navn som inneholder disse tegnene. Kodingproblemer (UTF-8 vs. Latin-2) i eldre rumenske dokumenter skaper ytterligere deteksjonsutfordringer.

Rumenske adresseformater: "Strada" (forkortet "Str."), "Bulevardul" (forkortet "Bd."), "Aleea" (forkortet "Al."), "Calea" (forkortet "Cal.") for gate typer. Rumenske lokaliteter inkluderer både byer (municipii) og kommuner (comune) med navnekonvensjoner som er forskjellige fra vest-europeiske adresseformater.

Rumenske navnemønstre: Rumenske navn følger spesifikke patronymiske og grammatiske konvensjoner. Det samme navnet vises i forskjellige grammatiske kasus avhengig av sin grammatiske rolle i setningen (nominativ, genitiv-dativ). NER-modeller må håndtere kasusvariasjon for å korrekt identifisere rumenske navn på tvers av dokumentkontekster.

ANSPDCPs håndhevelsesmønster

ANSPDCPs håndhevelsesaker følger et konsistent mønster som avslører de spesifikke tekniske feilene som fører til brudd:

BPO databrudd: Call center eller IT-støtteorganisasjoner lider av et databrudd. Undersøkelsen avslører at delte filer som inneholder rumenske ansatte CNP-numre og EU-kunde personopplysninger ble lagret uten tilstrekkelig kryptering. Vurderingen av bruddets omfang hemmes av utilstrekkelig logging — organisasjonen kan ikke bestemme nøyaktig hvilke poster som ble aksessert.

Helseopplysnings eksponering: Pasientjournaler som inneholder CNP-numre, helsekortnumre og diagnoseinformasjon deles utilsiktet med uautoriserte parter (sendt til feil mottaker, postet til feil skymappe). CNP-numrene ble ikke oppdaget eller pseudonymisert før deling fordi organisasjonens PII-verktøy ikke inkluderte støtte for rumenske identifikatorer.

Grensekryssing uten sikkerhetsforanstaltninger: Rumensk BPO-organisasjon overfører EU-kunde data (inkludert CNP-knyttede poster) til indiske underleverandører for datainntasting eller behandling, uten tilstrekkelig vurdering av overføringspåvirkning og standard kontraktsbestemmelser. CNP-numrene i de overførte filene skaper GDPR spesialkategori overføringsrisiko.

For rumensk GDPR-samsvar: CNP-detektering med modulo-11 sjekksumvalidering, rumensk språk NER med diakritisk bevisst behandling, og deteksjon av rumensk nasjonalt ID-kort er den tekniske basislinjen som ANSPDCPs håndhevelsesregister viser er nødvendig.

Kilder:

Klar til å beskytte dataene dine?

Begynn å anonymisere PII med 285+ enhetstyper på 48 språk.