Japonský zákon o ochraně osobních informací (APPI), významně revidovaný v roce 2022 a plně platný od dubna 2022, zahrnuje specifická ustanovení pro zpracování dat AI, která se liší od GDPR frameworku.
APPI Vs. GDPR: Klíčové Rozdíly pro AI
Anonymizovaně zpracovávané informace (匿名加工情報): APPI definuje specifickou kategorii „anonymizovaně zpracovávané informace" — data zpracovaná tak, aby nebyla možná identifikace konkrétní osoby ani obnova originálu. Organizace mohou zpracovávat tuto kategorii dat pro AI trénink bez souhlasu pod splnění technických požadavků.
Zprávy o chybách třetích stran: APPI Článek 24 vyžaduje zprávu regulátoru (PPC) pro přenosy dat třetím stranám v zámoří — podobně jako GDPR Článek 44 pro přenosy mimo EHP. Přenosy dat japonskými AI do cloudových systémů USA nebo EU vyžadují tuto zprávu.
Tréninková data AI bez souhlasu: APPI Revize 2022 zavedla specifický rámec pro zpracování osobních dat pro AI trénink, uznávajíce potřebu velkých datasetů. Za specifických podmínek je trénink AI možný bez individuálního souhlasu pokud jsou dodržena pravidla anonymizace.
Japonský My Number (個人番号, Kojin番号)
Japonské Individuální číslo (My Number) je 12místný identifikátor přiřazený každému japonskému rezidentovi:
XXXX XXXX XXXX
My Number je vysoce regulovaný — APPI My Number zákon (zákon o použití čísla) omezuje použití My Number na specifické vládní funkce: daně, sociální pojištění, katastrofy. My Number je zakázáno sbírat nebo zpracovávat pro soukromé obchodní účely.
Detekce výzva: 12místný formát bez separátorů je zaměňován s jinými číselnými sekvencemi. Specifická japonská validace vzoru je nezbytná, protože My Number má kontrolní číslice.
Japonský Kontext NER
Japonský text je obzvláště náročný pro NER:
- Tři skriptové systémy: Kanji, Hiragana, Katakana — japonská jména mohou být psána v kteroukoli kombinaci
- Žádné mezery mezi slovy — tokenizace vyžaduje japonsky specifický přístup
- Honorifika a kontext jmen jsou odlišné od latinských jazyků
Zdroje: