Το Αμερικανικό Πλεονέκτημα στην Εκπαίδευση NLP
Το αγγλόφωνο διαδίκτυο αντιπροσωπεύει την πλειονότητα του κειμένου εκπαίδευσης NLP. Τα αμερικανικά εθνικά αναγνωριστικά (SSN, EIN, αριθμοί άδειας οδήγησης κρατών) εμφανίζονται συχνά σε δεδομένα εκπαίδευσης NLP. Τα ευρωπαϊκά εθνικά αναγνωριστικά υποεκπροσωπούνται σε σχέση με τον πληθυσμό που καλύπτουν.
Χάρτης Αναγνωριστικών ΕΕ
| Χώρα | Αναγνωριστής | Μορφή | Επικύρωση |
|---|---|---|---|
| Γερμανία | Steuer-Identifikationsnummer | 11 ψηφία | Modulo-11 |
| Γαλλία | NIR/INSEE | 15 ψηφία | 97 - (NIR mod 97) |
| Σουηδία | Personnummer | YYMMDD-XXXX | Luhn |
| Ολλανδία | BSN | 9 ψηφία | Modulo-11 |
| Ισπανία | DNI/NIE | 8 ψηφία + γράμμα | Γράμμα επαλήθευσης |
| Ιταλία | Codice Fiscale | 16 χαρακτήρες | Αλφαριθμητικό |
| Ελλάδα | ΑΦΜ | 9 ψηφία | Σταθμισμένο άθροισμα |
| Πολωνία | PESEL | 11 ψηφία | Σταθμισμένο άθροισμα |
Κανένα από αυτά δεν εκπαιδεύεται αξιόπιστα στα πρότυπα US-centric NLP.
Πηγές: