ANSPDCP Rumunija: Detekcija CNP i GDPR provere
Azurirano za 2026.
Rumunski organ za zastitu podataka je ANSPDCP. Njegova procena iz 2024. pokazala je da 78% PII alata ne uspeva da detektuje Cod Numeric Personal (CNP). Vecina preskace korak kontrolne sume. Ta praznina stvara pravi rizik uskladjenosti. Rumunija obradjuje EU podatke za mnoge zapadne klijente. Izlozenost je sirsoka.
Rumunija najinformativniji nacionalni identifikator
CNP je 13-cifreni nacionalni identifikator. Svaka grupa cifara sadrzi licne podatke:
- Cifra 1: Kod pola i veka. Muski rodjen 1900-1999 = 1. Zenski rodjen 1900-1999 = 2. Muski rodjen 2000+ = 5. Zenski rodjen 2000+ = 6. Muski strani rezident = 7. Zenski strani rezident = 8. Ostali rezident = 9.
- Cifre 2-3: Poslednje dve cifre godine rodjenja.
- Cifre 4-5: Mesec rodjenja (01-12).
- Cifre 6-7: Dan rodjenja (01-31).
- Cifre 8-9: Kod okruga. Pokriva 41 okrug i sest sektora Bukuresta (kodovi 01-52).
- Cifre 10-12: Redni broj rodjenja tog dana i okruga.
- Cifra 13: Kontrolna cifra.
Sama cifra 1 otkriva bioloski pol. Prema GDPR clanu 9, to cini ovaj broj stavkom posebne kategorije podataka. Zahteva jacu zastitu od obicnih licnih podataka.
Kako funkcionise kontrolna cifra: Uzmite prvih 12 cifara. Pomnozite svaku njenom tezinom (2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9). Saberite rezultate. Podelite sa 11 i uzmite ostatak. Ostatak 10 daje kontrolnu cifru 1. Ostatak 11 znaci da kod nije validan. Bilo koji drugi ostatak je kontrolna cifra.
Alati koji preskacu ovaj test imaju dva nacina greske. Prvo, svaki 13-cifreni niz se oznacava kao podudaranje (lazni pozitivni). Drugo, ostecen broj prolazi proveru obrazca, ali sadrzi lose podatke. Ti podaci zahtevaju pregled, ali se propustaju (lazni negativni).
NER problemi u rumunskim dokumentima
Pronalazenje identifikatora je samo deo posla. Rumunski tekst dodaje vise prepreka za detekciju.
Dijakriticki znaci: Rumunski koristi s, t, a, a i i. Alati trenirani na drugim jezicima cesto propustaju imena sa ovim slovima. Stari dokumenti u Latin-2 kodiranju dodaju jos vise gresaka.
Formati adresa: Tipovi ulica koriste kratke forme - Str., Bd., Al., Cal. Nazivi gradova i komuna prate lokalna pravila. Parseri napravljeni za francuske ili nemacke adrese ovde slabo prolaze.
Promena oblika imena: U rumunskom jeziku, imena menjaju oblik prema gramatickom padezcu. Isto ime iste osobe izgleda razlicito u razlicitim delovima recenice. NER modeli moraju ovo obradivati da bi povezali imena kroz dokument.
Pogledajte nas vodic za detekciju PII u APAC regionu za to kako jezicke praznine uticu na detekciju u nezapadnim pismima.
Kako se razvijaju slucajevi ANSPDCP
Slucajevi ANSPDCP pokazuju tri obrasca.
Slucajevi krsenja u BPO-u: Deljene datoteke sadrze ID brojeve zaposlenih i EU korisnicke podatke bez enkripcije. Lose evidencije znace da firma ne moze reci kojim zapisima se pristupilo. To produzava istragu i povecava kaznu.
Izlozenost u zdravstvenoj zastiti: Pacijentske datoteke - nacionalni ID, ID zdravstvene kartice i dijagnoza - stizu do pogresne osobe. PII alat nije imao podrsku za ovaj format. Podaci su otisli bez maskiranja.
Gresci u prekogranicnom prenosu: Firma za outsourcing salje zapise povezane sa identifikatorima nekoj strani u zemlji koja nije u EEA. Nema procene uticaja prenosa. Nema standardnih ugovornih klauzula. Status clana 9 podataka pretvara uobicajenu prazninu u ozbiljniju povredu.
Tri kontrole za uskladjenost sa ANSPDCP
Ove tri cine minimalni tehnicki osnov:
- Detekcija CNP sa modulo-11 validacijom - samo podudaranje obrazaca nije dovoljno.
- NER svestan dijakritika - pokriti s, t, a, a i i u UTF-8 i Latin-2 izvorima.
- Detekcija licne karte - nacionalna kartica se pojavljuje uz CNP u mnogim tipovima dokumenata.
Za siri prikaz nacina na koji nacionalni ID-jevi stvaraju GDPR rizik, pogledajte nas vodic za detekciju EU nacionalnih poreskih ID-jeva.