Japoniako PPC eta APPI: AI Prestakuntza Datuen Betetzea
Japoniako PPCak APPI ezartzen du. 2022ko aldaketek aurretiko edozein eguneratzek baino gehiago aldatu zuten legea. Erregistro pseudonimizatuentzako, mugaz gaindiko transferentzietarako eta AI prestakuntza multzoetarako arauak gehitu zituzten. PPCak 45 ebazpen eman zituen 2024an. Urte berean Japan-espezifikoa den lehen AI pribatutasun gida ere argitaratu zuen.
Zure enpresak japoniar testuan ereduak prestatzen baditu edo japoniar erabiltzaileen erregistroak biltzen baditu, arau hauek orain aplikatzen dira.
2022ko Aldaketek Zer Aldatu Zuten
2,4 milioi japoniar enpresak pribatutasun arauak eguneratu eta kudeaketa urratsak berritu behar izan zituzten.
Informazio pseudonimizatua (仮名加工情報): Klase ertaineko berria. Identifikatzaile zuzenak kendutako erregistro pertsonalak biltzen ditu. Berreidentifikazioa oraindik posible da giltza bat badaukazu. Erregistro hauek erakunde barnean bidal daitezke baimenik gabe. Ezin dira hirugarrenei bidali. GDPRk ez du halako klaserik.
Informazio anonimizatua (匿名加工情報): Berreidentifikazioa teknikoki ezinezkoa izan behar da. Hirugarren kalifikatu batek hori baieztatu behar du. Japoniak GDPR baino barra altuagoa du puntu honetan. GDPRk berrikuspen hori hautazkoa egiten du. APPIk beharrezkoa egiten du.
Mugaz gaindiko transferentziak: Beste nazioetatara egindako transferentziek Japoniak ezarritako babes maila bete behar dute. PPCak onartutako herrialdeen zerrenda gordetzen du. EBa zerrendan dago.
AI prestakuntza multzoak: PPCaren 2024ko gidak zuzenean jorratu zuen hau.
- Prestakuntza multzoak guztiz anonimizatuta egon behar dira edo oinarri juridiko balioduna eduki behar dute — normalean baimena.
- Prozesatze salbuespena soilik aplikatzen da ereduak bere irteeretatik pertsonak identifikatu ezin baditu.
- Webguneetan bildutako japoniar erregistroekin prestatzen ari diren LLM garatzaileek bilketa oinarri baliodunak erakutsi behar dituzte.
Mugaz gaindiko lerrokatze betebeharren ikuspegi osoa lortzeko, ikusi /legal/compliance.
My Number: Japoniako Nazio Identifikazioa
My Number (マイナンバー) 12 zifrako nazio ID bat da. Japoniak biztanle guztiei ematen die. Atzerriko nazionalek ere jasotzen dute. Sistema 2016tik dago martxan. Zerga, gizarte segurantza eta hondamendi erantzuna hartzen ditu barne.
Egiaztapen digitua nola funtzionatzen duen: My Numberrek Verhoeff metodoa erabiltzen du. Matematikan oinarritutako errore egiaztapen eskema da. Luhn baino eraikitzeko zailago da — Suediako personnummer eta Kanadako SINerako erabiltzen den metodoa. Europar ID gehienek matematika modular sinpleagoa erabiltzen dute.
Zergatik den detekzio zaila: 12 zifrako kateen bilaketa soil batek ez du nahikoa egiten. Datak, posta kodeak eta faktura kodeak berdinak dirudite. Verhoeff logika osoa behar duzu bereizteko. Regex sinplea ez da nahikoa.
PPCaren 2024ko berrikuspenak aurkikuntza ikusgarria izan zuen. NLP tresna generikoen %63k My Number japoniar erregistroetan detektatzeko huts egiten du.
Ikusi nola kudeatzen duen anonym.legal-ek My Number /entities-en.
Hiru Idazketa Sistema Aldi Berean
Japonierak Hiragana, Katakana eta Kanji erabiltzen ditu aldi berean. Erromatar gidoia testuinguru batzuetan ere agertzen da. Izen bera erregistroen arabera desberdin itxuradun izan daiteke. Latin-gidoirako eraikitako tresnak japonieran huts egiten dute euskarri gabe.
Izen detekziorako zer esan nahi duen:
- Japoniar NERak japoniar testuan trebatutatko ereduak behar ditu. Erabili spaCy ja_core_news.
- Japonierak ez ditu zuriuneak hitzen artean. Hitz zatiketa urrats berezia da. Japan-jakitun tresnak behar ditu.
- Pertsona izenak Kanjiatan agertzen dira Hiragana edo Katakanako irakurketa gidoekin. Tresnek bi formak harrapatu behar dituzte.
- Enpresa izenak (会社名, 株式会社) Japan-espezifikoa arauak behar dituzte.
APAC hizkuntzetako NERrako, ikusi /docs/faq.
Beste Japoniar ID Formatuak
Gidabaimena: 12 zifra jaulkipen eskualdeko aurrizki kodea dutenak. Kodeak finkatuta daude — Tokioa 10 da, Osaka 62. Eskualde zatia egiaztagarria da.
Pasaportea: ICAO formatu estandarra Japan-espezifikoa jaulkipen arauekin.
Osasun Aseguru Txartela (健康保険証): Ikurra (記号) zenbakiarekin. Formatua aseguratzailearen arabera aldatzen da.
Egoitza Txartela (在留カード): Atzerriko egoiliarrentzat. Formatua: bi letra, zortzi zifra, bi letra. Justizia Ministerioak hauek jaulkitzen ditu.
Japonia-EB Datu Transferentzia Egoera
Japoniak eta EBak elkarrekiko egokitasuna dute 2019tik. Erregistro pertsonalak EBaren eta Japoniaren artean urrats gehigarririk gabe ibiltzen dira. Japonia EB egokitasun osoa duten Europaz kanpoko nazio gutxietako bat da.
Akordioak erregistro pertsonal estandarrak biltzen ditu. Osasun eta zigor historia erregistro sentikorrek egokitasunaren azpian ere babes gehigarriak behar dituzte. Erregistro hauek mugitzen dituzten enpresek erabiltzen dituzten urrats gehigarriak erregistratu behar dituzte.
Berrikusi zure transferentzia betebeharrak /security-compliance-n.
Zure Japoniako Betetzea Zerrenda
Hasiera hemen japoniar erregistro pertsonalak kudeatzen badituzu:
- My Number detekzioa Verhoeff egiaztapen-digitu logikaarekin.
- Japoniar NER japoniar-gidoitako testuan trebatutatko ereduekin — ez Latin-gidoi ereduak.
- Kanji, Hiragana eta Katakanako izen formuentzako eta irakurketa gido aldaeren laguntza.
- Gidabaimenen detekzioa eskualde kode egiaztapenekin.
- Egoitza Txartelaren detekzioa MOJ formatu logikaarekin.
- Osasun Aseguru Txartelaren detekzioa aseguratzaile aldaeren artean.
- Erregistro pertsonal pertsonalak dituen AI prestakuntza multzo bakoitzerako oinarri juridiko baliodunak.
- APPIren azpian anonimizatuta sailkatutako edozein erregistroren hirugarrenen berrikuspena.
- Erregistro sentikorrak EU-Japonia egokitasun akordioaren azpian mugitzeko babes gehigarriak.
Ikusi /docs/glossary gida honetan erabilitako APPI terminoen definizioentzat.