Παγκόσμια PII: SSN, CPF, Aadhaar και Άλλα
Το Πρόβλημα των Αμερικανοκεντρικών Εργαλείων PII
Τα περισσότερα εργαλεία PII σχεδιάστηκαν στις Ηνωμένες Πολιτείες. Στοχεύουν αμερικανικές μορφές δεδομένων. Ο αριθμός κοινωνικής ασφάλισης (SSN) έχει εννέα ψηφία σε μορφή ΑΑΑ-ΒΒ-CCCC. Τα τμήματά του — περιοχή, ομάδα και σειρά — ακολουθούν τεκμηριωμένους κανόνες. Τα εργαλεία με αμερικανική εστίαση τον εντοπίζουν αξιόπιστα. Ανιχνεύουν επίσης αμερικανικούς αριθμούς τηλεφώνου, διευθύνσεις email και άδειες οδήγησης. Αστοχούν σε κάθε εθνικό αναγνωριστικό εκτός ΗΠΑ.
Το GDPR δεν επιτρέπει καμία εξαίρεση για εργαλεία που καλύπτουν μόνο τις ΗΠΑ. Ας πάρουμε το γερμανικό Steuer-ID. Είναι ένα 11ψήφιο φορολογικό αναγνωριστικό. Το εκδίδει η Bundeszentralamt für Steuern. Το τελευταίο ψηφίο είναι αριθμός ελέγχου. Ταυτοποιεί έναν κάτοικο της Γερμανίας ακριβώς όπως ο SSN ταυτοποιεί έναν Αμερικανό. Το Άρθρο 4 του GDPR καλύπτει «κάθε πληροφορία που αφορά ταυτοποιημένο ή ταυτοποιήσιμο φυσικό πρόσωπο». Το Steuer-ID εμπίπτει σε αυτόν τον ορισμό. Αποτελεί προσωπικό δεδομένο. Αυτό ισχύει ανεξάρτητα από το αν το εργαλείο σας γνωρίζει τη μορφή του.
Πρόστιμα βάσει GDPR έχουν επιβληθεί για έκθεση ευρωπαϊκών PII σε συστήματα που χρησιμοποιούν εργαλεία μόνο για ΗΠΑ. Το κενό συμμόρφωσης είναι πραγματικό. Έχουν ακολουθήσει επιβολές. Δείτε τον οδηγό συμμόρφωσης με το GDPR για το πλαίσιο.
Το Ευρωπαϊκό Τοπίο Αναγνωριστικών
Το κενό κάλυψης είναι μεγάλο. Ακολουθεί ανάλυση ανά χώρα.
Γερμανία: Steuer-ID — 11 ψηφία, επικύρωση με αριθμό ελέγχου. Sozialversicherungsnummer — 12 πεδία, δομημένη μορφή. Reisepass — 10 χαρακτήρες με κωδικούς αρχής.
Γαλλία: Το NIR είναι το εθνικό αναγνωριστικό κοινωνικής ασφάλισης. Έχει 15 ψηφία. Κωδικοποιεί φύλο, έτος γέννησης, μήνα γέννησης, διαμέρισμα, κοινότητα και αριθμό ελέγχου. Το SIRET έχει 14 ψηφία. Το SIREN έχει εννέα.
Σουηδία: Το Personnummer χρησιμοποιεί τη μορφή ΕΕΜΜΗΗ-ΧΧΧΧ. Το Samordningsnummer καλύπτει μη μόνιμους κατοίκους. Η τιμή της ημέρας αυξάνεται κατά 60.
Νορβηγία: Το Fødselsnummer έχει 11 ψηφία σε μορφή ΗΗΜΜΕΕ ΝΝΝΚΚ. Το φύλο κωδικοποιείται στη μεσαία ομάδα. Στο D-nummer η τιμή της ημέρας αυξάνεται κατά 40.
Βραζιλία: Το CPF — Cadastro de Pessoas Físicas — έχει 11 ψηφία με δύο τιμές ελέγχου. Το CNPJ είναι το 14ψήφιο αναγνωριστικό επιχείρησης.
Ινδία: Το Aadhaar είναι ένα 12ψήφιο βιομετρικό αναγνωριστικό. Χρησιμοποιεί αλγόριθμο ελέγχου Verhoeff. Το PAN είναι ένα 10ψήφιο φορολογικό αναγνωριστικό με γράμματα και αριθμούς.
ΗΑΕ: Το Emirates ID έχει 15 ψηφία σε μορφή 784-έτος γέννησης-ακολουθία-αριθμός ελέγχου.
Μια παγκόσμια ομάδα HR που καλύπτει 12 χώρες χρειάζεται ένα εργαλείο. Πρέπει να χειρίζεται και τις 12 εθνικές μορφές αναγνωριστικών σε ένα μόνο πέρασμα. Η συντήρηση ξεχωριστών βιβλιοθηκών regex ανά χώρα δεν είναι βιώσιμη.
Η Αρχιτεκτονική 285+ Τύπων Οντοτήτων
Η βιβλιοθήκη 285+ τύπων οντοτήτων καλύπτει όλες τις μορφές των κρατών-μελών της ΕΕ. Καλύπτει επίσης τα κύρια αναγνωριστικά της Ασίας-Ειρηνικού. Αυτά περιλαμβάνουν Aadhaar, PAN, CPF, CNPJ, Emirates ID και ταϊλανδέζικη ταυτότητα πολίτη. Οι αμερικανικές μορφές — SSN, EIN, άδειες οδήγησης πολιτειών — συμπεριλαμβάνονται επίσης. Ένας μηχανισμός τα χειρίζεται όλα. Η βιβλιοθήκη ενημερώνεται καθώς αλλάζουν οι μορφές.
Αυτό είναι το κενό που αφήνουν ανοιχτό τα περισσότερα εργαλεία. Δείτε την αναφορά οντοτήτων για να ελέγξετε τι καλύπτεται. Για τιμολόγηση API βάσει όγκου, επισκεφθείτε τη σελίδα τιμών.