Japonskej komisii na ochranu osobných údajov (PPC) vydala 45 vynútvovacích rozhodnutí v roku 2024 a publikovala prvý pokyn PPC špecifický pre AI týkajúci sa ochrany súkromia. Technická hodnotenie PPC z roku 2024 zistila, že 63% generických nástrojov NLP nasadených na spracovanie japonských dokumentov zlyhá pri presnej detekcii čísla My Number (マイナンバー) — japonského 12-ciferného národného identifikačného čísla. Pre organizácie s operáciami v Japonsku alebo spracovávajúce údaje japonských občanov táto medzera vytváram priamý problém súladu s APPI.
My Number: Výzva overovania Verhoeff
Japonský systém jednotného čísla (マイナンバー制度, systém My Number) prideľuje jedinečné 12-ciferné číslo každému obyvateľovi Japonska (1,36 miliardy používateľov). My Number sa používa na:
- Správu daní (daňové návrahy, vyhlasovaní srážky na zdroji)
- Sociálne zabezpečenie (dôchodok, registrácia zdravotného poistenia)
- Odozvu na katastrofu (identifikácia v núdzových situáciách)
Algoritmus Verhoeff: Kontrolná číslica My Number používa algoritmus Verhoeff — skupinovo-teoretický algoritmus detekcie chýb, ktorý môže zistiť všetky chyby s jednou číslicou a všetky chyby susednej transpozície. Algoritmus používa tri vyhľadávacie tabuľky: multiplikačnú tabuľku dihedral skupiny (D5), inverznú tabuľku a tabuľku permutácie.
Implementácia Verhoeff vyžaduje udržiavanie týchto troch tabuliek a aplikáciu sekvencie vyhľadávaní. Na rozdiel od algoritmu Luhn (jednoduchá modulárna aritmetika) sa Verhoeff nemôže vypočítať mentálne — vyžaduje si programátickú implementáciu.
Prečo je to dôležité pre detekciu PII:
- My Number...