Οδηγός Τεχνικής Συμμόρφωσης APPI: My Number Ιαπωνικής Ανίχνευσης
Τι είναι ο Αριθμός Μου της Ιαπωνίας;
Στη Ιαπωνία, ο My Number (マイナンバー) είναι ένας εθνικός αναγνωριστικός αριθμός που εκδόθηκε το 2016. Είναι ένας 12ψήφιος αριθμός που αποτελείται από:
- Ψηφία 1-11: Τυχαίοι αριθμοί που δόθηκαν κατά τη δημιουργία
- Ψηφίο 12: Ψηφίο ελέγχου (υπολογισμένο χρησιμοποιώντας τον αλγόριθμο Verhoeff)
Ο αριθμός μου χρησιμοποιείται για φόρολογία, αρχείο υγείας και κοινωνικές παροχές. Δεν είναι δημόσιος αναγνωρισμός και δεν χρησιμοποιείται τυπικά για καθημερινές συναλλαγές.
Γιατί ο My Number Είναι Ευαίσθητος
Ο My Number θεωρείται εξαιρετικά ευαίσθητο προσωπικό δεδομένο υπό το APPI (Ιαπωνικός Νόμος Προστασίας Προσωπικών Δεδομένων). Η αιτία:
Ασυνήθιστα απόλυτη ταυτότητα: Ο My Number είναι σταθερός, μοναδικός και δεν αλλάζει καθ' όλη τη διάρκεια της ζωής. Δεν υπάρχει "ακυρωμένος" ή "νέος" My Number.
Συνδεδεμένη δεδομένα: Το My Number συνδέει φόρολογικές αρχείες, αρχεία κοινωνικής ασφάλισης και αρχεία υγείας — δεδομένα που συνήθως απομονώνονται.
Κανόνες χρήσης:
Οι οργανώσεις που συλλέγουν δεδομένα My Number πρέπει:
- Να κρυπτογραφήσουν τα δεδομένα My Number κατά τη μετάδοση και αποθήκευση (AES-256 ή ισοδύναμο)
- Να ελέγχουν την εγκυρότητα του ψηφίου ελέγχου Verhoeff κατά τη λήψη
- Να αποτρέψουν τη δημιουργία αντιγράφων ή άλλης αποθήκευσης
Αναγνώριση Αριθμού Μου: Τεχνικές Προκλήσεις
Εγκυρότητα ψηφίου ελέγχου Verhoeff:
Ο My Number χρησιμοποιεί τον αλγόριθμο Verhoeff (όχι modulo-11 ή το απλούστερο Luhn που χρησιμοποιείται στις πιστωτικές κάρτες).
Verhoeff check digit algorithm (simplified):
1. Δεδομένα: 11 ψηφία d1...d11
2. Εισαγάγετε πίνακες Verhoeff d[], p[], inv[]
3. Για i = 11 μέχρι 1:
c = d[(c + d[p[12-i][di]])]
4. Ψηφίο ελέγχου = inv[c]
Τα αποτελέσματα:
- Η τυχαία 12ψήφια ακολουθία έχει πιθανότητα 1/10 να περάσει την επαλήθευση Verhoeff (όχι 0,01 όπως το modulo-11)
- Ψευδοθετικές: ~10% χρησιμοποιώντας απλό patternRecognizer
Κανόνες μοτίβου:
Οι έγκυροι αριθμοί My Number απαιτούν:
- 12 ψηφία ακριβώς
- Ψηφίο ελέγχου Verhoeff που ταιριάζει με τα ψηφία 1-11
- Συνήθως NOT εμφανίζεται σε κείμενο ως "123-4567-8901" (με διαχωριστές)
Υλοποίηση Anonym.Legal
Oι αναγνωριστές anonym.legal για My Number:
Recognizer JapanMyNumber:
- Pattern:
\b\d{12}\b(12 συνεχόμενα ψηφία) - Epvalidation: Υπολογισμό αλγόριθμου Verhoeff
- Εμπιστοσύνη: 0,8 (εγκύρως ψηφία ελέγχου) έως 0,5 (χωρίς)
- Υποστηριζόμενες γλώσσες: ja, en
Αποτέλεσμα:
{
"entity_type": "JP_MY_NUMBER",
"start": 42,
"end": 54,
"score": 0.95,
"text": "123456789012"
}
Πίνακες ψηφίων Verhoeff:
Ο αλγόριθμος Verhoeff χρησιμοποιεί τρεις πίνακες: d, p, inv. Αυτοί είναι σταθεροί και καθορίζονται από τη Ιαπωνία:
VERHOEFF_D = [
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
[1, 2, 3, 4, 0, 6, 7, 8, 9, 5],
[2, 3, 4, 0, 1, 7, 8, 9, 5, 6],
# ...
]
VERHOEFF_P = [
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
[1, 2, 3, 4, 5, 6, 7, 8, 9, 0],
# ...
]
VERHOEFF_INV = [0, 4, 3, 2, 1, 5, 6, 7, 8, 9]
Απαιτήσεις APPI και Συμμόρφωση
PPC (Personal Information Protection Commission) του Ιαπωνικού:
Οργανώσεις που επεξεργάζονται δεδομένα My Number πρέπει:
- Κρυπτογράφηση: Όλα τα δεδομένα My Number πρέπει να κρυπτογραφηθούν με AES-256 (ή ισοδύναμο) κατά τη μετάδοση και αποθήκευση
- Έλεγχος ακρίβειας: Επαληθεύστε ψηφία Verhoeff πριν την αποθήκευση
- Λογιστικό: Διατηρήστε audit-trail όλων των προσπαθειών πρόσβασης
- Ελάχιστη δεδομένα: Αποθηκεύστε μόνο τα απολύτως απαραίτητα
- Διακοπή σύνδεσης: Κατάργηση όλων των My Number αποθηκευμένων μετά από ένα έτος αποδοχής
Πολιτική Ανωνυμοποίησης
Αντί για κρυπτογράφηση, οι οργανώσεις μπορούν να ανωνυμοποιήσουν δεδομένα My Number χρησιμοποιώντας:
Μέθοδος 1: Αντικατάσταση σχήματος
Αρχικό: 123456789012
Αντικαταστάθηκε: [PERSON-JP-12345]
Μέθοδος 2: Κατακερματισμός
Αρχικό: 123456789012
SHA-256(123456789012) = 7f9e3b2a1c...
Αποθηκευμένο: 7f9e3b2a1c... (κρυπτογράφηση κλειδιού κατά τη διακοπή σύνδεσης)
Μέθοδος 3: Καθαρή διακοπή σύνδεσης (Κατάργηση)
Αποδοχή δεδομένων → Επεξεργασία → Κατάργηση My Number
Αποθηκευμένο: <αποδοχή ID>, <αποτέλεσμα>
Καμία αποθήκευση My Number
Μελέτη Περίπτωσης: Τραπεζικό Σύστημα Αποδοχής Ιαπωνίας
Μια ιαπωνική τράπεζα αναβάθμισε τη διαδικασία ενημέρωσης λογαριασμού για ζητήσεις συμμόρφωσης APPI:
Πριν: Έγγραφα PDF που περιέχουν αριθμούς My Number αποθηκεύθηκαν σε κοινή αποθηκευμένη θέση με χαμηλής κρυπτογράφησης προστασία.
Πρόβλημα ανίχνευσης: My Number δεν φάνηκε σε κανένα σύστημα DLP. Λόγος:
- 12 ψηφία χωρίς ψηφίο ελέγχου Verhoeff δεν ήταν κατάλληλη
- Scanned PDF έκοδες χαρακτήρες αποδόσεως ως εικόνα, όχι κείμενο
Λύση: anonym.legal's My Number recognizer που αποτυχία σε αποσκευασμένα PDF με ενσωμάτωση OCR. Αναμεταφορά (redact) σύστημα προστατευμένο από έγγραφα που περιέχουν My Number.