anonym.legal
Πίσω στο BlogGDPR & Συμμόρφωση

Γιατί το Εργαλείο Ανίχνευσης PII σας Συμμορφώνεται με...

Ένα γερμανικό Steuer-ID, ένα γαλλικό NIR και ένα σουηδικό Personnummer απαιτούν διαφορετική λογική ανίχνευσης.

March 3, 202610 λεπτά ανάγνωσης
multilingualGDPRNLPPII detectionEuropean compliancespaCyXLM-RoBERTa

Το Κρυφό Χάσμα Συμμόρφωσης GDPR

Το GDPR δεν έχει γλωσσική προτίμηση. Το Άρθρο 4(1) ορίζει "προσωπικά δεδομένα" χωρίς αναφορά στη γλώσσα. Ένα γερμανικό Steuer-ID είναι τόσο προστατευμένο όσο ένας αμερικανικός αριθμός κοινωνικής ασφάλισης. Ένα γαλλικό NIR είναι τόσο ρυθμισμένο όσο ένας βρετανικός αριθμός ασφάλισης.

Αλλά τα περισσότερα εργαλεία ανίχνευσης PII κατασκευάστηκαν για αγγλικά.

Έρευνα που δημοσιεύτηκε στο ACL 2024 διαπίστωσε ότι υβριδικές προσεγγίσεις NLP επιτυγχάνουν βαθμολογίες F1 0,60-0,83 για ευρωπαϊκές τοπικές ρυθμίσεις—αλλά τα εργαλεία μόνο για αγγλικά που εφαρμόζονται σε μη αγγλικό κείμενο βαθμολογούν κοντά στο μηδέν για δομημένα εθνικά αναγνωριστικά.

Γιατί το PII Είναι Γλωσσικά Ειδικό

Δομημένα Αναγνωριστικά Διαφέρουν Ριζικά ανά Χώρα

ΧώραΦορολογικό ΑναγνωριστικόΜορφήΑπαίτηση Ανίχνευσης
ΓερμανίαSteuer-ID11 ψηφία, αλγόριθμος αθροίσματος ελέγχουΕπικύρωση Modulo-11
ΓαλλίαNIR15 ψηφία + κλειδί 2 ψηφίωνΕπικύρωση αλγορίθμου INSEE
ΣουηδίαPersonnummer10 ψηφία, δείκτης αιώναΕπικύρωση Luhn
ΠολωνίαPESEL11 ψηφία, κωδικοποιημένη ημερομηνία γέννησηςΕπικύρωση Modulo-10
ΟλλανδίαBSN9 ψηφία, elfproef (έλεγχος-11)Αλγόριθμος Elfproef
ΙσπανίαDNI/NIE8 ψηφία + γράμμαΕπικύρωση Modulo-23
ΙταλίαCodice Fiscale16 αλφαριθμητικάΣύνθετο άθροισμα ελέγχου

Η Προσέγγιση 48 Γλωσσών του anonym.legal

Το anonym.legal υποστηρίζει 48 γλώσσες με πλήρη εθνικά αναγνωριστικά:

  • Ευρωπαϊκές γλώσσες: Γερμανικά (Steuer-ID, Reisepass), Γαλλικά (NIR, numéro de sécurité sociale), Ισπανικά (DNI/NIE/CIF), Ιταλικά (Codice Fiscale)
  • Σκανδιναβικές γλώσσες: Σουηδικά (Personnummer), Δανέζικα (CPR), Νορβηγικά (Fødselsnummer), Φινλανδικά (HETU)
  • Ανατολικοευρωπαϊκές γλώσσες: Πολωνικά (PESEL), Τσεχικά (rodné číslo), Ουγγρικά (adóazonosító jel)
  • Ελληνικά: ΑΦΜ, ΑΜΚΑ, ΑΔΤ - πλήρης υποστήριξη ελληνικών αναγνωριστικών

Το GDPR ισχύει σε όλες τις γλώσσες—το εργαλείο ανίχνευσης PII σας πρέπει επίσης να ισχύει.


Πηγές:

Έτοιμοι να προστατεύσετε τα δεδομένα σας;

Ξεκινήστε την ανωνυμοποίηση PII με 285+ τύπους οντοτήτων σε 48 γλώσσες.