Zpět na blogGDPR a shoda

Japonský PPC APPI 2022: Zákon o ochraně soukromí...

Japonský zákon o ochraně osobních informací (APPI) z roku 2022 má specifické pokyny pro AI tréninková data, které se liší od GDPR.

April 21, 202610 min čtení
Japan PPCAPPI complianceMy Number detectionJapanese privacy lawAsia Pacific

Japonský zákon o ochraně osobních informací (APPI), významně revidovaný v roce 2022 a plně platný od dubna 2022, zahrnuje specifická ustanovení pro zpracování dat AI, která se liší od GDPR frameworku.

APPI Vs. GDPR: Klíčové Rozdíly pro AI

Anonymizovaně zpracovávané informace (匿名加工情報): APPI definuje specifickou kategorii „anonymizovaně zpracovávané informace" — data zpracovaná tak, aby nebyla možná identifikace konkrétní osoby ani obnova originálu. Organizace mohou zpracovávat tuto kategorii dat pro AI trénink bez souhlasu pod splnění technických požadavků.

Zprávy o chybách třetích stran: APPI Článek 24 vyžaduje zprávu regulátoru (PPC) pro přenosy dat třetím stranám v zámoří — podobně jako GDPR Článek 44 pro přenosy mimo EHP. Přenosy dat japonskými AI do cloudových systémů USA nebo EU vyžadují tuto zprávu.

Tréninková data AI bez souhlasu: APPI Revize 2022 zavedla specifický rámec pro zpracování osobních dat pro AI trénink, uznávajíce potřebu velkých datasetů. Za specifických podmínek je trénink AI možný bez individuálního souhlasu pokud jsou dodržena pravidla anonymizace.

Japonský My Number (個人番号, Kojin番号)

Japonské Individuální číslo (My Number) je 12místný identifikátor přiřazený každému japonskému rezidentovi:

XXXX XXXX XXXX

My Number je vysoce regulovaný — APPI My Number zákon (zákon o použití čísla) omezuje použití My Number na specifické vládní funkce: daně, sociální pojištění, katastrofy. My Number je zakázáno sbírat nebo zpracovávat pro soukromé obchodní účely.

Detekce výzva: 12místný formát bez separátorů je zaměňován s jinými číselnými sekvencemi. Specifická japonská validace vzoru je nezbytná, protože My Number má kontrolní číslice.

Japonský Kontext NER

Japonský text je obzvláště náročný pro NER:

  • Tři skriptové systémy: Kanji, Hiragana, Katakana — japonská jména mohou být psána v kteroukoli kombinaci
  • Žádné mezery mezi slovy — tokenizace vyžaduje japonsky specifický přístup
  • Honorifika a kontext jmen jsou odlišné od latinských jazyků

Zdroje:

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.