Japan PPC og APPI: Samsvar ved opplæring av KI-modeller
Japans PPC håndhever APPI. Endringene fra 2022 endret loven mer enn noen tidligere revisjon. De innførte regler for pseudonymiserte opplysninger, grensekryssende overføringer og opplæringssett for KI. PPC fattet 45 vedtak i 2024. Det samme året publiserte de den første Japan-spesifikke veiledningen for personvern i KI.
Dersom bedriften din trener modeller på japansk tekst eller oppbevarer personopplysninger om japanske brukere, gjelder disse reglene allerede nå.
Hva endringene fra 2022 innebar
2,4 millioner japanske virksomheter måtte oppdatere sine personvernsrutiner og revidere sine håndteringsprosedyrer.
Pseudonymisert informasjon (仮名加工情報): En ny mellomkategori. Den dekker personopplysninger der direkte identifikatorer er fjernet. Gjenidentifisering er fortsatt mulig dersom man har en nøkkel. Slike opplysninger kan flyttes internt i en organisasjon uten fullt samtykke. De kan ikke overføres til tredjeparter. GDPR har ingen tilsvarende kategori.
Anonymisert informasjon (匿名加工情報): Gjenidentifisering må være teknisk umulig. En kvalifisert tredjepart må bekrefte dette. Japans krav er strengere enn GDPR på dette punktet. GDPR gjør slik gjennomgang valgfri. APPI gjør den obligatorisk.
Grensekryssende overføringer: Overføringer til andre land må oppfylle Japans beskyttelsesnivå. PPC fører en liste over godkjente land. EU er på denne listen.
Opplæringssett for KI: PPC-veiledningen fra 2024 behandlet dette direkte.
- Opplæringssett må være fullt anonymisert eller basert på et gyldig rettsgrunnlag — som regel samtykke.
- Behandlingsunntaket gjelder bare dersom modellen ikke kan identifisere enkeltpersoner fra sine resultater.
- LLM-utviklere som trener på japanske opplysninger hentet fra nettsteder, må dokumentere et gyldig grunnlag for innsamlingen.
For en fullstendig oversikt over plikter ved grensekryssende samsvar, se /legal/compliance.
My Number: Japans nasjonale ID
My Number (マイナンバー) er et 12-sifret nasjonalt ID-nummer. Japan tildeler det til alle bosatte. Utenlandske statsborgere får det også. Systemet har vært i drift siden 2016. Det dekker skatt, trygd og katastrofehåndtering.
Slik fungerer kontrollsifferet: My Number bruker Verhoeff-metoden. Det er et matematisk feilkontrollsystem. Det er vanskeligere å implementere enn Luhn — metoden som brukes for svensk personnummer og canadisk SIN. De fleste europeiske ID-formater bruker enklere modulær matematikk.
Hvorfor deteksjon er vanskelig: Et søk etter 12-sifrede strenger vil bomme. Datoer, postnumre og fakturakoder ser like ut. Du trenger full Verhoeff-logikk for å skille dem fra hverandre. Enkel regex er ikke nok.
PPCs gjennomgang fra 2024 hadde et klart funn: 63 % av generiske NLP-verktøy klarer ikke å oppdage My Number i japanske dokumenter.
Se hvordan anonym.legal håndterer My Number på /entities.
Tre skriftsystemer på en gang
Japansk bruker hiragana, katakana og kanji samtidig. Latinske bokstaver forekommer også i enkelte sammenhenger. Det samme navnet kan se ulikt ut på tvers av dokumenter. Verktøy bygget for latinbasert tekst svikter på japansk uten ekstra støtte.
Hva dette betyr for navnedeteksjon:
- Japansk NER trenger modeller trent på japansk tekst. Bruk spaCy ja_core_news.
- Japansk har ingen mellomrom mellom ord. Orddeling er et eget steg som krever Japan-bevisste verktøy.
- Personnavn skrives med kanji og leseveiledning i hiragana eller katakana. Verktøy må fange begge former.
- Selskapsnavn (会社名, 株式会社) krever Japan-spesifikke regler.
For NER på tvers av APAC-språk, se /docs/faq.
Andre japanske ID-formater
Førerkort: 12 siffer med en prefikskode for utstedelsesregionen. Kodene er faste — Tokyo er 10, Osaka er 62. Regiondelen kan valideres.
Pass: Standard ICAO-format med Japan-spesifikke utstedelsesregler.
Helseforsikringskort (健康保険証): Symbol (記号) pluss nummer. Formatet varierer etter forsikringsgiver.
Oppholdskort (在留カード): For utenlandske bosatte. Format: to bokstaver, åtte siffer, to bokstaver. Justisdepartementet utsteder disse.
Status for dataoverføringer mellom Japan og EU
Japan og EU har hatt gjensidig tilstrekkelighet siden 2019. Personopplysninger kan flyte mellom EU og Japan uten ekstra tiltak. Japan er ett av svært få land utenfor Europa med full EU-tilstrekkelighet.
Avtalen dekker vanlige personopplysninger. Sensitive helse- og strafferegistre krever ekstra sikkerhetstiltak selv under tilstrekkelighetsavtalen. Virksomheter som overfører slike opplysninger, må dokumentere tiltakene de bruker.
Gjennomgå dine overføringsplikter på /security-compliance.
Din sjekkliste for Japan-samsvar
Begynn her hvis du behandler japanske personopplysninger:
- My Number-deteksjon med Verhoeff-kontrollsifferlogikk.
- Japansk NER med modeller trent på japansk skrift — ikke latinbaserte modeller.
- Støtte for kanji-, hiragana- og katakanaformer av navn samt varianter med leseveiledning.
- Førerkortsdeteksjon med regionkodevalidering.
- Oppholdskortdeteksjon med MOJ-formatlogikk.
- Helseforsikringskortdeteksjon på tvers av forsikringsgivervarianter.
- Et gyldig rettsgrunnlag for hvert KI-opplæringssett som inneholder personopplysninger.
- Tredjeparts gjennomgang for opplysninger klassifisert som anonymisert under APPI.
- Ekstra sikkerhetstiltak for sensitive opplysninger som overføres under EU-Japan-tilstrekkelighetsavtalen.
Se /docs/glossary for APPI-begrepsdefinisjoner brukt i denne veiledningen.