جاپان PPC اور APPI: AI تربیتی ڈیٹا کی تعمیل
جاپان کا PPC، APPI نافذ کرتا ہے۔ 2022 کی ترامیم نے قانون کو پہلے سے کہیں زیادہ بدل دیا۔ انہوں نے چھدم نامزد ریکارڈز، سرحد پار منتقلی، اور AI تربیتی سیٹوں کے لیے قواعد شامل کیے۔ PPC نے 2024 میں 45 فیصلے جاری کیے۔ اس نے اس سال پہلی جاپان کی مخصوص AI رازداری رہنمائی بھی شائع کی۔
اگر آپ کی کمپنی جاپانی متن پر ماڈل تربیت دیتی ہے یا جاپانی صارف ریکارڈ رکھتی ہے، تو یہ قواعد ابھی لاگو ہوتے ہیں۔
2022 کی ترامیم نے کیا بدلا
24 لاکھ جاپانی کمپنیوں کو رازداری کے قواعد اپ ڈیٹ کرنے اور نمٹانے کے طریقوں کو نئے سرے سے ترتیب دینا پڑا۔
چھدم نامزد معلومات (仮名加工情報): ایک نئی درمیانی درجہ بندی۔ اس میں براہ راست شناخت کنندگان کے بغیر ذاتی ریکارڈ شامل ہیں۔ دوبارہ شناخت اب بھی ممکن ہے اگر آپ کے پاس کلید ہو۔ یہ ریکارڈ بغیر مکمل رضامندی کے کسی تنظیم کے اندر منتقل ہو سکتے ہیں۔ وہ فریق ثالث کو نہیں جا سکتے۔ GDPR میں ایسی کوئی درجہ بندی نہیں ہے۔
گمنام معلومات (匿名加工情報): دوبارہ شناخت تکنیکی طور پر ناممکن ہونی چاہیے۔ ایک اہل فریق ثالث کو اس کی تصدیق کرنی ہوگی۔ جاپان کا معیار اس نکتے پر GDPR سے سخت ہے۔ GDPR اس جائزہ کو اختیاری بناتا ہے۔ APPI اسے لازمی قرار دیتا ہے۔
سرحد پار منتقلی: دوسرے ممالک کو منتقلی جاپان کے تحفظ کے معیار پر پوری اترنی چاہیے۔ PPC منظور شدہ ممالک کی فہرست رکھتا ہے۔ EU اس فہرست میں ہے۔
AI تربیتی سیٹ: PPC کی 2024 رہنمائی نے اسے براہ راست حل کیا۔
- تربیتی سیٹ مکمل طور پر گمنام ہونے چاہئیں یا کسی درست قانونی بنیاد پر ہونے چاہئیں — عموماً رضامندی۔
- پروسیسنگ استثنیٰ صرف اس صورت میں لاگو ہوتا ہے جب ماڈل اپنے آؤٹ پٹ سے لوگوں کی شناخت نہ کر سکے۔
- LLM ڈویلپرز جو ویب سائٹوں سے اکٹھے جاپانی ریکارڈ پر تربیت لیتے ہیں، انہیں ایک درست جمع کرنے کی بنیاد ثابت کرنی ہوگی۔
سرحد پار صف بندی کے فرائض کا مکمل نظریہ کے لیے، /legal/compliance دیکھیں۔
My Number: جاپان کی قومی ID
My Number (マイナンバー) ایک 12 ہندسی قومی ID ہے۔ جاپان اسے تمام رہائشیوں کو جاری کرتا ہے۔ غیر ملکی شہریوں کو بھی ملتا ہے۔ یہ نظام 2016 سے چل رہا ہے۔ یہ ٹیکس، سماجی تحفظ، اور آفات کے ردعمل کو کور کرتا ہے۔
چیک ڈیجٹ کیسے کام کرتا ہے: My Number Verhoeff طریقہ استعمال کرتا ہے۔ یہ ریاضی پر مبنی غلطی جانچ کا طریقہ ہے۔ اسے بنانا Luhn سے زیادہ مشکل ہے — وہ طریقہ جو سویڈش personnummer اور کینیڈین SIN کے لیے استعمال ہوتا ہے۔ زیادہ تر یورپی IDs آسان ماڈیولر ریاضی استعمال کرتی ہیں۔
شناخت مشکل کیوں ہے: 12 ہندسی تاروں کی تلاش نشان سے چوک جائے گی۔ تاریخیں، پوسٹل کوڈ، اور انوائس کوڈ سب ایک جیسے لگتے ہیں۔ انہیں الگ کرنے کے لیے آپ کو مکمل Verhoeff منطق چاہیے۔ سادہ regex کافی نہیں ہے۔
PPC کے 2024 جائزے میں ایک تیکھا نتیجہ تھا۔ عام NLP ٹولز کا 63٪ جاپانی ریکارڈ میں My Number کا پتہ لگانے میں ناکام رہا۔
دیکھیں کہ anonym.legal My Number کو /entities پر کیسے سنبھالتا ہے۔
ایک ساتھ تین تحریری نظام
جاپانی ایک ساتھ Hiragana، Katakana، اور Kanji استعمال کرتا ہے۔ کچھ سیاق و سباق میں Roman اسکرپٹ بھی ظاہر ہوتی ہے۔ وہی نام ریکارڈز میں مختلف نظر آ سکتا ہے۔ لاطینی اسکرپٹ متن کے لیے بنائے گئے ٹولز اضافی معاونت کے بغیر جاپانی پر ناکام ہوتے ہیں۔
نام کی شناخت کے لیے اس کا کیا مطلب ہے:
- جاپانی NER کو جاپانی متن پر تربیت یافتہ ماڈل کی ضرورت ہے۔ spaCy ja_core_news استعمال کریں۔
- جاپانی میں الفاظ کے درمیان کوئی جگہ نہیں ہے۔ لفظ تقسیم ایک الگ قدم ہے۔ اسے جاپان سے واقف ٹولز کی ضرورت ہے۔
- شخص کے نام Kanji میں Hiragana یا Katakana میں پڑھنے کے رہنماؤں کے ساتھ ظاہر ہوتے ہیں۔ ٹولز کو دونوں شکلوں کو پکڑنا چاہیے۔
- کمپنی کے نام (会社名、株式会社) کو جاپان سے مخصوص قواعد کی ضرورت ہے۔
APAC زبانوں میں NER کے لیے، /docs/faq دیکھیں۔
جاپانی ID فارمیٹس
ڈرائیونگ لائسنس: جاری کرنے والے علاقے کے لیے پریفکس کوڈ کے ساتھ 12 ہندسے۔ کوڈ ثابت ہیں — ٹوکیو 10 ہے، اوساکا 62 ہے۔ علاقے کا حصہ قابل تصدیق ہے۔
پاسپورٹ: جاپان سے مخصوص جاری کرنے کے قواعد کے ساتھ معیاری ICAO فارمیٹ۔
صحت بیمہ کارڈ (健康保険証): علامت (記号) نمبر کے ساتھ۔ فارمیٹ بیمہ کار کے لحاظ سے مختلف ہوتا ہے۔
رہائش کارڈ (在留カード): غیر ملکی رہائشیوں کے لیے۔ فارمیٹ: دو حروف، آٹھ ہندسے، دو حروف۔ وزارت انصاف یہ جاری کرتی ہے۔
جاپان-EU ڈیٹا منتقلی کی صورتحال
جاپان اور EU کے درمیان 2019 سے باہمی مناسبیت ہے۔ ذاتی ریکارڈ اضافی اقدامات کے بغیر EU اور جاپان کے درمیان بہتے ہیں۔ جاپان ان چند غیر یورپی ممالک میں سے ایک ہے جس کے پاس مکمل EU مناسبیت ہے۔
یہ معاہدہ معیاری ذاتی ریکارڈ کو کور کرتا ہے۔ حساس صحت اور مجرمانہ تاریخ کے ریکارڈ کو مناسبیت کے تحت بھی اضافی حفاظتی اقدامات کی ضرورت ہے۔ ان ریکارڈز کو منتقل کرنے والی کمپنیوں کو وہ اضافی اقدامات لاگ کرنے ہوں گے جو وہ استعمال کرتی ہیں۔
/security-compliance پر اپنے منتقلی فرائض کا جائزہ لیں۔
آپ کی جاپان تعمیل چیک لسٹ
اگر آپ جاپانی ذاتی ریکارڈ سنبھالتے ہیں تو یہاں سے شروع کریں:
- Verhoeff چیک ڈیجٹ منطق کے ساتھ My Number کی شناخت۔
- جاپانی اسکرپٹ متن پر تربیت یافتہ ماڈل کے ساتھ جاپانی NER — لاطینی اسکرپٹ ماڈل نہیں۔
- Kanji، Hiragana، اور Katakana نام کی شکلوں کے ساتھ پڑھنے کی رہنمائی کی اقسام کی معاونت۔
- علاقے کوڈ چیکس کے ساتھ ڈرائیونگ لائسنس کی شناخت۔
- MOJ فارمیٹ منطق کے ساتھ رہائش کارڈ کی شناخت۔
- جاری کنندہ کی اقسام میں صحت بیمہ کارڈ کی شناخت۔
- ہر AI تربیتی سیٹ کے لیے ایک درست قانونی بنیاد جس میں ذاتی ریکارڈ ہوں۔
- APPI کے تحت گمنام کے طور پر درجہ بند کسی بھی ریکارڈ کے لیے فریق ثالث کا جائزہ۔
- EU-جاپان مناسبیت کے معاہدے کے تحت منتقل ہونے والے حساس ریکارڈ کے لیے اضافی حفاظتی اقدامات۔
اس رہنمائی میں استعمال ہونے والی APPI اصطلاحات کی تعریفوں کے لیے /docs/glossary دیکھیں۔