Japan PPC og APPI: Samsvar ved opplæring av KI-modeller

Japans PPC håndhever APPI. Endringene fra 2022 endret loven mer enn noen tidligere revisjon. De innførte regler for pseudonymiserte opplysninger, grensekryssende overføringer og opplæringssett for KI. PPC fattet 45 vedtak i 2024. Det samme året publiserte de den første Japan-spesifikke veiledningen for personvern i KI.

Dersom bedriften din trener modeller på japansk tekst eller oppbevarer personopplysninger om japanske brukere, gjelder disse reglene allerede nå.

Hva endringene fra 2022 innebar

2,4 millioner japanske virksomheter måtte oppdatere sine personvernsrutiner og revidere sine håndteringsprosedyrer.

Pseudonymisert informasjon (仮名加工情報): En ny mellomkategori. Den dekker personopplysninger der direkte identifikatorer er fjernet. Gjenidentifisering er fortsatt mulig dersom man har en nøkkel. Slike opplysninger kan flyttes internt i en organisasjon uten fullt samtykke. De kan ikke overføres til tredjeparter. GDPR har ingen tilsvarende kategori.

Anonymisert informasjon (匿名加工情報): Gjenidentifisering må være teknisk umulig. En kvalifisert tredjepart må bekrefte dette. Japans krav er strengere enn GDPR på dette punktet. GDPR gjør slik gjennomgang valgfri. APPI gjør den obligatorisk.

Grensekryssende overføringer: Overføringer til andre land må oppfylle Japans beskyttelsesnivå. PPC fører en liste over godkjente land. EU er på denne listen.

Opplæringssett for KI: PPC-veiledningen fra 2024 behandlet dette direkte.

Opplæringssett må være fullt anonymisert eller basert på et gyldig rettsgrunnlag — som regel samtykke.
Behandlingsunntaket gjelder bare dersom modellen ikke kan identifisere enkeltpersoner fra sine resultater.
LLM-utviklere som trener på japanske opplysninger hentet fra nettsteder, må dokumentere et gyldig grunnlag for innsamlingen.

For en fullstendig oversikt over plikter ved grensekryssende samsvar, se /legal/compliance.

My Number: Japans nasjonale ID

My Number (マイナンバー) er et 12-sifret nasjonalt ID-nummer. Japan tildeler det til alle bosatte. Utenlandske statsborgere får det også. Systemet har vært i drift siden 2016. Det dekker skatt, trygd og katastrofehåndtering.

Slik fungerer kontrollsifferet: My Number bruker Verhoeff-metoden. Det er et matematisk feilkontrollsystem. Det er vanskeligere å implementere enn Luhn — metoden som brukes for svensk personnummer og canadisk SIN. De fleste europeiske ID-formater bruker enklere modulær matematikk.

Hvorfor deteksjon er vanskelig: Et søk etter 12-sifrede strenger vil bomme. Datoer, postnumre og fakturakoder ser like ut. Du trenger full Verhoeff-logikk for å skille dem fra hverandre. Enkel regex er ikke nok.

PPCs gjennomgang fra 2024 hadde et klart funn: 63 % av generiske NLP-verktøy klarer ikke å oppdage My Number i japanske dokumenter.

Se hvordan anonym.legal håndterer My Number på /entities.

Tre skriftsystemer på en gang

Japansk bruker hiragana, katakana og kanji samtidig. Latinske bokstaver forekommer også i enkelte sammenhenger. Det samme navnet kan se ulikt ut på tvers av dokumenter. Verktøy bygget for latinbasert tekst svikter på japansk uten ekstra støtte.

Hva dette betyr for navnedeteksjon:

Japansk NER trenger modeller trent på japansk tekst. Bruk spaCy ja_core_news.
Japansk har ingen mellomrom mellom ord. Orddeling er et eget steg som krever Japan-bevisste verktøy.
Personnavn skrives med kanji og leseveiledning i hiragana eller katakana. Verktøy må fange begge former.
Selskapsnavn (会社名, 株式会社) krever Japan-spesifikke regler.

For NER på tvers av APAC-språk, se /docs/faq.

Andre japanske ID-formater

Førerkort: 12 siffer med en prefikskode for utstedelsesregionen. Kodene er faste — Tokyo er 10, Osaka er 62. Regiondelen kan valideres.

Pass: Standard ICAO-format med Japan-spesifikke utstedelsesregler.

Helseforsikringskort (健康保険証): Symbol (記号) pluss nummer. Formatet varierer etter forsikringsgiver.

Oppholdskort (在留カード): For utenlandske bosatte. Format: to bokstaver, åtte siffer, to bokstaver. Justisdepartementet utsteder disse.

Status for dataoverføringer mellom Japan og EU

Japan og EU har hatt gjensidig tilstrekkelighet siden 2019. Personopplysninger kan flyte mellom EU og Japan uten ekstra tiltak. Japan er ett av svært få land utenfor Europa med full EU-tilstrekkelighet.

Avtalen dekker vanlige personopplysninger. Sensitive helse- og strafferegistre krever ekstra sikkerhetstiltak selv under tilstrekkelighetsavtalen. Virksomheter som overfører slike opplysninger, må dokumentere tiltakene de bruker.

Gjennomgå dine overføringsplikter på /security-compliance.

Din sjekkliste for Japan-samsvar

Begynn her hvis du behandler japanske personopplysninger:

My Number-deteksjon med Verhoeff-kontrollsifferlogikk.
Japansk NER med modeller trent på japansk skrift — ikke latinbaserte modeller.
Støtte for kanji-, hiragana- og katakanaformer av navn samt varianter med leseveiledning.
Førerkortsdeteksjon med regionkodevalidering.
Oppholdskortdeteksjon med MOJ-formatlogikk.
Helseforsikringskortdeteksjon på tvers av forsikringsgivervarianter.
Et gyldig rettsgrunnlag for hvert KI-opplæringssett som inneholder personopplysninger.
Tredjeparts gjennomgang for opplysninger klassifisert som anonymisert under APPI.
Ekstra sikkerhetstiltak for sensitive opplysninger som overføres under EU-Japan-tilstrekkelighetsavtalen.

Se /docs/glossary for APPI-begrepsdefinisjoner brukt i denne veiledningen.

Kilder

Relaterte Artikler

GDPR & Overholdelse

Klar til å beskytte dataene dine?

Begynn å anonymisere PII med 285+ enhetstyper på 48 språk.

Start Gratis Prøveperiode Se Funksjoner

Japan PPC APPI: Samsvar ved opplæring av KI-modeller

Japan PPC og APPI: Samsvar ved opplæring av KI-modeller

Hva endringene fra 2022 innebar

My Number: Japans nasjonale ID

Tre skriftsystemer på en gang

Andre japanske ID-formater

Status for dataoverføringer mellom Japan og EU

Din sjekkliste for Japan-samsvar

Kilder

Relaterte Artikler

Selvhostet PII mislykkes i compliance-revisjoner

Presidio mangler 220+ GDPR-enheter

Konfigurasjonsdrift: En skjult GDPR-risiko

Klar til å beskytte dataene dine?

Japan PPC APPI: Samsvar ved opplæring av KI-modeller

Japan PPC og APPI: Samsvar ved opplæring av KI-modeller

Hva endringene fra 2022 innebar

My Number: Japans nasjonale ID

Tre skriftsystemer på en gang

Andre japanske ID-formater

Status for dataoverføringer mellom Japan og EU

Din sjekkliste for Japan-samsvar

Kilder

Relaterte Artikler

Selvhostet PII mislykkes i compliance-revisjoner

Presidio mangler 220+ GDPR-enheter

Konfigurasjonsdrift: En skjult GDPR-risiko

Klar til å beskytte dataene dine?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow