Ճապոնիայի My Number. APPI և Verhoeff Ստուգումը
Ճապոնիայի Անձնական տեղեկությունների պաշտպանության հանձնաժողովը (PPC) 2024-ին կայացրեց 45 կիրարկման վճիռ: Հրատարակեց նաև Ճապոնիայի առաջին AI-ի գաղտնիության ուղեցույցը: PPC-ի ուսումնասիրությունը պարզեց, որ ընդհանուր NLP գործիքների 63%-ն ի վիճակի չէ ճապոներեն ֆայլերում հայտնաբերելու My Number-ը (マイナンバー): Եթե ձեր թիմը կառավարում է ճապոնական բնակիչների տվյալներ, այդ բացը ուղղակի APPI-ի ռիսկ է:
Ինչ է My Number-ը
Ճապոնիան ամեն բնակչի տալիս է 12-նիշ եզակի նույնացուցիչ: Սա My Number-ն է, Անհատ Համարի Համակարգի մի մաս (マイナンバー制度): Ծածկում է հարկը, կենսաթոշակը, առողջության ապահովագրությունը և արտակարգ արձագանքը: Այս նույնացուցիչը APPI-ով զգայուն տվյալ է: Այն հավաքելու կամ փոխանցելու համար անհրաժեշտ է իրավական հիմք:
Verhoeff Ստուգման Խնդիրը
My Number-ն օգտագործում է Verhoeff ալգորիթմ իր ստուգիչ նիշի համար: Verhoeff-ը մաթեմատիկական մեթոդ է, որն ախտահայտում է բոլոր մեկ-նիշ սխալները: Հայտնաբերում է նաև բոլոր սխալները, երբ երկու հարևան նիշ փոխվում են: Աշխատելու համար պահանջում է երեք ստուգման աղյուսակ: Ձեռքով հաշվարկել հնարավոր չէ: Կոդ է պահանջում:
Սա կարևոր է երկու պատճառով: Առաջին, Ճապոնիայի 12-նիշ ձևաչափը նման է շատ այլ կոդերի: Հաշիվ-ապրանքագրի հղումներ, փաստաթղթի ID-ներ և ամսաթվային տողեր բոլորն ունեն նույն ձևաչափը: Verhoeff-ի ստուգման բացակայության դեպքում գործիքը կկառոտ արժեքներ նշի: Երկրորդ, գործիքների մեծ մասն օգտագործում է ավելի պարզ մոդուլո-10 կամ մոդուլո-11 ստուգումներ: Դրանք այստեղ չեն աշխատի:
PPC-ի ուսումնասիրությունը պարզեց, որ գործիքների 63%-ն ստուգումն բաց է թողնում կամ ավելի պարզ մեթոդ է օգտագործում: Երկու խնդիրն էլ միաժամանակ են ի հայտ գալիս. կեղծ դրականներ և բացասականներ:
Luhn ալգորիթmը, որն օգտագործվում է բանկային քարտերի համար, ավելի պարզ է: My Number-ն օգտագործում չի Luhn: Luhn-ի համար կառուցված գործիքները չեն աշխատի:
Երեք Գիր, Մեկ Անուն
Ճապոներեն տեքստն օգտագործում է երեք գրչամական համակարգ միաժամանակ: Գործիքը պետք է կարողանա երեքն էլ կառավարել:
Hiragana (ひらがな). Օգտագործվում է քերականության և բնիկ բառերի համար: 46 բազային նիշ:
Katakana (カタカナ). Օգտագործվում է արտաբնիկ բառերի և անունների համար: 46 բազային նիշ: Ճապոնիայում օտարազգիների անունները հայտնվում են այս գրով:
Kanji (漢字). Գոյականների և անունների համար նշաններ: Մոտ 2,000 օգտագործվում է ամենօրյա:
Մեկ անձի անունը կարող է հայտնվել չորս ձևով. Kanji (田中太郎), Hiragana (たなかたろう), Katakana (タナカ タロウ) և Romaji (Tanaka Taro): Գործիքը պետք է բոլոր չորսին ճանաչի: Եթե մեկը բաց թողնի, այդ անձի գրառumների մեծ մասը բաց կթողնի:
Հայտնաբերելու Ճապոնական Այլ ID-ներ
Ավտոտրանսպորտային իրավունք (運転免許証番号). 12 նիշ: Առաջին երկու նիշերը ցույց են տալիս նահանգամարզը: Տոկիոն՝ 10: Օսական՝ 62: Սա թույլ է տալիս գործիքին ստուգել, արդյոք արժեքը վավեր է այդ տարածաշրջանի համար:
Անձնագիր (旅券番号). Երկու տառ ու յոթ նիշ: ICAO ձևաչափ: Ճապոնիան օգտագործում է հատուկ տառային զույգեր:
Առողջապահության ապահովագրության քարտ (健康保険証記号番号). Նշան ու թիվ: Ձևաչափը կախված է ապահովիչից: Ազգային Առողջության Ապահovagutyunը (国民健康保険) և Ընկերությամբ Կառavarvats Ապahovich (協会けんぽ) օgtvorum en tarber dzevachaner:
Բնակության քarт (在留カード番号). Otar bnakichnerum. Erku tar, uth tskanotsk, erku tar. Ardaragoutyoun Orenkri Ministerstvoне tramadrum е:
APPI-ի Անանունացման Կանոնը
APPI-ն ունի խստացված անանונացված տվyaleri stndart, kovchvats anonymized information (匿名加工情報): Avaelin e GDPR-its mek karevir khndrum. Anonymizatsia petq e linei yecerord kolmov verifikaveli ev tekhnikan anshrerjakeli:
Hambavarel hamar kazmakerputyun petq e:
- Hanel bolor ughiho nuynanshannere, aylishkn My Number-e:
- Karaverel bolor kvazi-nuynanshanni kombinatsianer:
- Ogtvorel k-anonymity kam hamarzhek metod:
- Hashvegrutyun hrataragutyunyem anelvats qaylerits:
- Yerbeq չveranuynatsutsanel tvyannere:
PPC-i 2024-i AI oughtecuytsn avellatsnum e mek karachtir kanonn. Ethe AI-e soverorvoum e anonymized tvyannerov, chi kareli varzvel ayd modele markanс veranuynatsutselu hamar. Sа APPI-i ouvchman komplektnerum modelayin inversiayi vjraki ughghaki artgelem е:
PPC-i normerun hamar karkevi eq cherekutyun. Aradjin, Verhoeff vaveraberoutyoun My Number-i haytnaberoutyan hamar. Erkordn, yaponakan NER ja_core_news-ov paymanavorvats tokenizatsiayi het. Yerrord, anunnerum ajelev Kanji, Kana ev Romaji-um. Chorrord, naxanashakayin kod stugaymeliy e avtotransportayin iravounknerum.
Hndkastanum ogtvorvoum e Aadhaar, vorin nuynskep anhrrazesht е Verhoeff vaveraberoutyun: Hndkastani DPDPA tekhnikan hamapataskhanutyyan oughtecuytsn manambanavorum e das manambanapov: Bazmaerkneri nuynanshani haytnaberoutyan hamar tes ES azgayin harkayin ID-i haytnaberoutyun GDPR-i hamapataskhanutyyan nerqo: