Japonya PPC ve APPI: Yapay Zeka Eğitim Verisi Uyumluluğu
Japonya'nın PPC'si APPI'yi uygular. 2022 değişiklikleri yasayı önceki herhangi bir güncellemeden çok daha kapsamlı biçimde değiştirdi. Takma ad verilmiş kayıtlar, sınır ötesi transferler ve yapay zeka eğitim setleri için yeni kurallar eklendi. PPC 2024'te 45 karar verdi. Aynı yıl Japonya'ya özgü ilk yapay zeka gizlilik kılavuzunu da yayımladı.
Şirketiniz Japonca metinler üzerinde model eğitiyorsa veya Japon kullanıcı kayıtları tutuyorsa bu kurallar şu anda geçerlidir.
2022 Değişiklikleri Neler Getirdi
2,4 milyon Japon şirketi gizlilik kurallarını güncellemek ve işleme adımlarını yeniden düzenlemek zorunda kaldı.
Takma ad verilmiş bilgiler (仮名加工情報): Yeni bir ara kategori. Doğrudan tanımlayıcıları kaldırılmış kişisel kayıtları kapsar. Bir anahtara sahipseniz yeniden tanımlama hâlâ mümkündür. Bu kayıtlar tam rıza olmaksızın bir kuruluş içinde aktarılabilir. Üçüncü taraflara gönderilemez. GDPR'da böyle bir kategori yoktur.
Anonim bilgiler (匿名加工情報): Yeniden tanımlama teknik olarak imkânsız olmalıdır. Nitelikli bir üçüncü taraf bunu onaylamalıdır. Japonya'nın bu konudaki standardı GDPR'dan daha yüksektir. GDPR bu incelemeyi isteğe bağlı kılar; APPI ise zorunlu tutar.
Sınır ötesi transferler: Diğer ülkelere yapılan transferler Japonya'nın koruma standardını karşılamalıdır. PPC onaylı ülkelerin listesini tutar. AB bu listede yer almaktadır.
Yapay zeka eğitim setleri: PPC'nin 2024 tarihli kılavuzu bu konuyu doğrudan ele almaktadır.
- Eğitim setleri tamamen anonimleştirilmiş olmalı ya da geçerli bir hukuki dayanağa — genellikle rıza — sahip olmalıdır.
- İşleme istisnası yalnızca modelin çıktılarından kişileri tanımlayamaması durumunda geçerlidir.
- Web sitelerinden toplanan Japonca kayıtlar üzerinde LLM geliştiren geliştiriciler, geçerli bir toplama dayanağı göstermek zorundadır.
Sınır ötesi uyum yükümlülüklerinin tamamına ilişkin bilgi için /legal/compliance sayfamıza bakın.
My Number: Japonya'nın Ulusal Kimlik Numarası
My Number (マイナンバー), 12 haneli bir ulusal kimlik numarasıdır. Japonya bunu tüm sakinlerine verir. Yabancı uyrukluların da My Number'ı bulunur. Sistem 2016'dan bu yana yürürlüktedir. Vergi, sosyal güvenlik ve afet müdahalesini kapsar.
Kontrol hanesi nasıl çalışır: My Number, Verhoeff yöntemini kullanır. Bu, matematiksel temelli bir hata denetim şemasıdır. İsveç personnummer ve Kanada SIN için kullanılan Luhn yöntemine kıyasla oluşturması daha güçtür. Avrupa kimlik belgelerinin büyük çoğunluğu daha basit modüler matematik kullanır.
Tespiti neden zordur: 12 haneli diziler için yapılan tarama çoğu zaman işe yaramaz. Tarihler, posta kodları ve fatura kodlarının tamamı aynı görünür. Bunları birbirinden ayırt etmek için tam Verhoeff mantığı gerekir; basit regex yeterli değildir.
PPC'nin 2024 incelemesi çarpıcı bir bulguyu ortaya koydu: Genel amaçlı NLP araçlarının %63'ü Japonca kayıtlardaki My Number'ı tespit etmekte başarısız oluyor.
anonym.legal'in My Number'ı nasıl ele aldığını görmek için /entities sayfamıza bakın.
Aynı Anda Üç Yazı Sistemi
Japonca, Hiragana, Katakana ve Kanji'yi aynı anda kullanır. Bazı bağlamlarda Roman harfleri de görünür. Aynı isim kayıtlarda farklı biçimlerde yazılabilir. Yalnızca Latin alfabeli metinler için geliştirilmiş araçlar, ek destek olmaksızın Japonca'da başarısız olur.
İsim tespiti açısından ne anlama gelir:
- Japonca NER, Japonca metinler üzerinde eğitilmiş modeller gerektirir. spaCy ja_core_news kullanın.
- Japonca'da sözcükler arasında boşluk yoktur. Kelime bölme ayrı bir adımdır. Japonca destekli araçlar gerektirir.
- Kişi adları Kanji ile yazılır; okunuş kılavuzları Hiragana veya Katakana ile gösterilir. Araçlar her iki formu da yakalayabilmelidir.
- Şirket adları (会社名, 株式会社) Japonya'ya özgü kurallar gerektirir.
APAK dilleri genelinde NER için /docs/faq sayfamıza bakın.
Diğer Japonya Kimlik Formatları
Ehliyet: Veriliş bölgesini gösteren önek koduyla birlikte 12 hane. Kodlar sabittir — Tokyo 10, Osaka 62'dir. Bölge kısmı doğrulanabilir.
Pasaport: Japonya'ya özgü veriliş kurallarıyla standart ICAO formatı.
Sağlık Sigortası Kartı (健康保険証): Sembol (記号) artı numara. Format sigortacıya göre değişir.
İkamet Kartı (在留カード): Yabancı sakinler için. Format: iki harf, sekiz rakam, iki harf. Adalet Bakanlığı tarafından verilir.
Japonya–AB Veri Transferi Durumu
Japonya ve AB, 2019'dan bu yana karşılıklı yeterliliğe sahiptir. Kişisel veriler AB ile Japonya arasında ek işlem yapılmaksızın aktarılabilir. Japonya, tam AB yeterlilik statüsüne sahip çok az sayıda Avrupalı olmayan ülkeden biridir.
Anlaşma standart kişisel kayıtları kapsar. Hassas sağlık ve adli sicil kayıtları, yeterlilik kapsamında bile ek güvenceler gerektirir. Bu kayıtları aktaran şirketler, uyguladıkları ek önlemleri kayıt altına almalıdır.
Transfer yükümlülüklerinizi /security-compliance adresinden inceleyin.
Japonya Uyumluluk Kontrol Listeniz
Japon kişisel kayıtlarını işliyorsanız buradan başlayın:
- Verhoeff kontrol hanesi mantığıyla My Number tespiti.
- Japonca yazı üzerinde eğitilmiş modellerle Japonca NER — Latin alfabesi modellerini kullanmayın.
- Okunuş kılavuzu varyantlarıyla birlikte Kanji, Hiragana ve Katakana isim formlarına destek.
- Bölge kodu kontrolleriyle ehliyet tespiti.
- Adalet Bakanlığı format mantığıyla İkamet Kartı tespiti.
- Sigorta varyantlarında Sağlık Sigortası Kartı tespiti.
- Kişisel veri içeren her yapay zeka eğitim seti için geçerli bir hukuki dayanak.
- APPI kapsamında anonim olarak sınıflandırılan kayıtlar için üçüncü taraf incelemesi.
- AB–Japonya yeterlilik anlaşması kapsamında aktarılan hassas kayıtlar için ek güvenceler.
Bu kılavuzda kullanılan APPI terim tanımları için /docs/glossary sayfamıza bakın.