ANSPDCP Ρουμανία: Ανίχνευση CNP και Έλεγχοι GDPR
Ενημερώθηκε για το 2026
Η αρχή δεδομένων της Ρουμανίας είναι η ANSPDCP. Η αξιολόγηση του 2024 διαπίστωσε ότι το 78% των εργαλείων PII αποτυγχάνει να ανιχνεύσει το Cod Numeric Personal (CNP). Τα περισσότερα παραλείπουν το βήμα του αθροίσματος ελέγχου. Αυτό το κενό δημιουργεί πραγματικό κίνδυνο συμμόρφωσης. Η Ρουμανία επεξεργάζεται δεδομένα ΕΕ για πολλούς δυτικούς πελάτες. Η έκθεση είναι ευρεία.
Το Πιο Πλούσιο σε Δεδομένα Εθνικό Αναγνωριστικό της Ρουμανίας
Το CNP είναι ένας 13ψήφιος εθνικός αριθμός ταυτότητας. Κάθε ομάδα ψηφίων περιέχει προσωπικά δεδομένα:
- Ψηφίο 1: Κωδικός φύλου και αιώνα. Άρρεν γεννημένος 1900–1999 = 1. Θήλυ γεννημένη 1900–1999 = 2. Άρρεν γεννημένος 2000+ = 5. Θήλυ γεννημένη 2000+ = 6. Άρρεν αλλοδαπός κάτοικος = 7. Θήλυ αλλοδαπή κάτοικος = 8. Άλλος κάτοικος = 9.
- Ψηφία 2–3: Τα δύο τελευταία ψηφία του έτους γέννησης.
- Ψηφία 4–5: Μήνας γέννησης (01–12).
- Ψηφία 6–7: Ημέρα γέννησης (01–31).
- Ψηφία 8–9: Κωδικός νομού. Καλύπτει 41 νομούς και τους έξι τομείς του Βουκουρεστίου (κωδικοί 01–52).
- Ψηφία 10–12: Σειρά γέννησης εντός εκείνης της ημέρας και νομού.
- Ψηφίο 13: Ψηφίο ελέγχου.
Το ψηφίο 1 αποκαλύπτει μόνο του το βιολογικό φύλο. Σύμφωνα με το Άρθρο 9 GDPR, αυτό καθιστά τον αριθμό αυτό στοιχείο δεδομένων ειδικής κατηγορίας. Χρειάζεται ισχυρότερη προστασία από τα συνηθισμένα προσωπικά δεδομένα.
Πώς λειτουργεί το ψηφίο ελέγχου: Λάβετε τα πρώτα 12 ψηφία. Πολλαπλασιάστε το καθένα με το βάρος του (2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9). Αθροίστε τα αποτελέσματα. Διαιρέστε με το 11 και λάβετε το υπόλοιπο. Υπόλοιπο 10 δίνει ψηφίο ελέγχου 1. Υπόλοιπο 11 σημαίνει ότι ο κωδικός δεν είναι έγκυρος. Οποιοδήποτε άλλο υπόλοιπο είναι το ψηφίο ελέγχου.
Τα εργαλεία που παραλείπουν αυτή τη δοκιμή έχουν δύο τρόπους αποτυχίας. Πρώτον, οποιαδήποτε συμβολοσειρά 13 ψηφίων επισημαίνεται ως αντιστοίχιση (ψευδώς θετικά). Δεύτερον, ένας κατεστραμμένος αριθμός περνά τον έλεγχο μοτίβου αλλά περιέχει κακά δεδομένα. Αυτά τα δεδομένα χρειάζονται επανεξέταση και χάνονται (ψευδώς αρνητικά).
Προβλήματα NER σε Ρουμανόφωνα Έγγραφα
Η εύρεση αναγνωριστικών είναι μόνο μέρος της εργασίας. Τα ρουμανικά κείμενα προσθέτουν περισσότερα εμπόδια ανίχνευσης.
Διακριτικά σημεία: Τα Ρουμανικά χρησιμοποιούν ș, ț, ă, â και î. Τα εργαλεία εκπαιδευμένα σε άλλες γλώσσες συχνά χάνουν ονόματα με αυτά τα γράμματα. Παλιά έγγραφα σε κωδικοποίηση Latin-2 προσθέτουν περισσότερες αποτυχίες.
Μορφές διευθύνσεων: Οι τύποι οδών χρησιμοποιούν σύντομες μορφές — Str., Bd., Al., Cal. Τα ονόματα πόλεων και κοινοτήτων ακολουθούν τοπικούς κανόνες. Οι αναλυτές που δημιουργήθηκαν για γαλλικές ή γερμανικές διευθύνσεις τα πηγαίνουν άσχημα εδώ.
Κλίση ονομάτων: Τα ονόματα αλλάζουν μορφή ανά γραμματική πτώση στα Ρουμανικά. Το ίδιο όνομα ατόμου φαίνεται διαφορετικό σε διαφορετικά μέρη μιας πρότασης. Τα μοντέλα NER πρέπει να χειρίζονται αυτό για να συνδέουν ονόματα σε ένα έγγραφο.
Δείτε τον οδηγό ανίχνευσης PII APAC για το πώς τα γλωσσικά κενά επηρεάζουν την ανίχνευση σε μη-δυτικά γραφήματα.
Πώς Εξελίσσονται οι Υποθέσεις ANSPDCP
Οι υποθέσεις ANSPDCP δείχνουν τρία μοτίβα.
Υποθέσεις παραβίασης BPO: Κοινόχρηστα αρχεία περιέχουν αριθμούς ταυτότητας υπαλλήλων και δεδομένα πελατών ΕΕ χωρίς κρυπτογράφηση. Τα κακά αρχεία καταγραφής σημαίνουν ότι η εταιρεία δεν μπορεί να πει ποια αρχεία είχαν πρόσβαση. Αυτό παρατείνει την έρευνα και αυξάνει το πρόστιμο.
Έκθεση υγειονομικής περίθαλψης: Αρχεία ασθενών — ο εθνικός αριθμός ταυτότητας, ο αριθμός κάρτας υγείας και η διάγνωση — φτάνουν στο λάθος πρόσωπο. Το εργαλείο PII δεν υποστήριζε αυτή τη μορφή. Τα δεδομένα αναχώρησαν χωρίς απόκρυψη.
Αποτυχίες διασυνοριακής μεταφοράς: Μια εταιρεία εξωτερικής ανάθεσης αποστέλλει αρχεία συνδεδεμένα με αναγνωριστικό σε τρίτο μέρος εκτός ΕΟΧ. Χωρίς Εκτίμηση Αντίκτυπου Μεταφοράς. Χωρίς Τυποποιημένες Συμβατικές Ρήτρες. Η κατάσταση Άρθρου 9 των δεδομένων μετατρέπει ένα συνηθισμένο κενό σε πιο σοβαρή παραβίαση.
Τρεις Έλεγχοι για Συμμόρφωση με την ANSPDCP
Αυτοί οι τρεις αποτελούν την ελάχιστη τεχνική βάση:
- Ανίχνευση CNP με επαλήθευση modulo-11 — η αντιστοίχιση μοτίβων μόνο δεν αρκεί.
- NER με επίγνωση διακριτικών — κάλυψη ș, ț, ă, â και î τόσο σε πηγές UTF-8 όσο και Latin-2.
- Ανίχνευση δελτίου ταυτότητας — η εθνική ταυτότητα εμφανίζεται δίπλα στο CNP σε πολλούς τύπους εγγράφων.
Για ευρύτερη άποψη σχετικά με τον τρόπο που τα εθνικά αναγνωριστικά δημιουργούν κίνδυνο GDPR, δείτε τον οδηγό ανίχνευσης εθνικού ΑΦΜ ΕΕ.