ANSPDCP رومانیہ: CNP شناخت اور GDPR چیکس
2026 کے لیے اپ ڈیٹ
رومانیہ کا ڈیٹا ادارہ ANSPDCP ہے۔ اس کے 2024 کے جائزے نے پایا کہ 78% PII ٹولز Cod Numeric Personal (CNP) کا پتہ لگانے میں ناکام رہتے ہیں۔ زیادہ تر checksum مرحلہ چھوڑ دیتے ہیں۔ یہ خلا حقیقی تعمیل خطرہ پیدا کرتا ہے۔ رومانیہ بہت سے مغربی مؤکلوں کے لیے EU ڈیٹا پروسیس کرتا ہے۔ نمائش وسیع ہے۔
رومانیہ کا سب سے زیادہ ڈیٹا سے بھرپور قومی ID
CNP ایک 13 ہندسوں کا قومی شناخت کنندہ ہے۔ ہر ہندسے کا گروپ ذاتی ڈیٹا رکھتا ہے:
- ہندسہ 1: صنف اور صدی کوڈ۔ 1900–1999 میں پیدا ہونے والے مرد = 1۔ 1900–1999 میں پیدا ہونے والی خواتین = 2۔ 2000+ میں پیدا ہونے والے مرد = 5۔ 2000+ میں پیدا ہونے والی خواتین = 6۔ مرد غیر ملکی رہائشی = 7۔ خاتون غیر ملکی رہائشی = 8۔ دیگر رہائشی = 9۔
- ہندسے 2–3: پیدائشی سال کے آخری دو ہندسے۔
- ہندسے 4–5: پیدائشی مہینہ (01–12)۔
- ہندسے 6–7: پیدائشی دن (01–31)۔
- ہندسے 8–9: کاؤنٹی کوڈ۔ 41 کاؤنٹیز اور بخارسٹ کے چھ سیکٹرز (کوڈ 01–52) شامل ہیں۔
- ہندسے 10–12: اس دن اور کاؤنٹی میں پیدائش کی ترتیب۔
- ہندسہ 13: چیک ہندسہ۔
اکیلے ہندسہ 1 حیاتیاتی جنس ظاہر کرتا ہے۔ GDPR آرٹیکل 9 کے تحت، یہ اس نمبر کو خصوصی زمرے کی ڈیٹا آئٹم بناتا ہے۔ اسے عام ذاتی ڈیٹا سے زیادہ مضبوط تحفظ درکار ہے۔
چیک ہندسہ کیسے کام کرتا ہے: پہلے 12 ہندسے لیں۔ ہر ایک کو اپنے وزن (2، 7، 9، 1، 4، 6، 3، 5، 8، 2، 7، 9) سے ضرب دیں۔ نتائج جمع کریں۔ 11 سے تقسیم کریں اور باقی لیں۔ 10 کی باقی چیک ہندسہ 1 دیتی ہے۔ 11 کی باقی مطلب کوڈ درست نہیں ہے۔ کوئی بھی دوسری باقی چیک ہندسہ ہے۔
جو ٹولز یہ ٹیسٹ چھوڑ دیتے ہیں ان کے دو ناکامی کے طریقے ہیں۔ پہلا، کوئی بھی 13 ہندسوں کی تار میچ کے طور پر نشان زد ہو جاتی ہے (جھوٹی مثبت)۔ دوسرا، ایک خراب نمبر پیٹرن چیک پاس کر جاتا ہے لیکن خراب ڈیٹا رکھتا ہے۔ وہ ڈیٹا جائزے کی ضرورت ہے اور چھوٹ جاتا ہے (جھوٹی منفی)۔
رومانیائی زبان کی دستاویزات میں NER کے مسائل
شناخت کنندگان کا پتہ لگانا کام کا صرف حصہ ہے۔ رومانیائی متن مزید شناخت کی رکاوٹیں پیدا کرتا ہے۔
ڈائیکریٹکس: رومانیائی ș، ț، ă، â، اور î استعمال کرتی ہے۔ دوسری زبانوں پر تربیت یافتہ ٹولز اکثر ان حروف والے ناموں کو چھوڑ دیتے ہیں۔ Latin-2 انکوڈنگ میں پرانی دستاویزات مزید ناکامیاں پیدا کرتی ہیں۔
پتے کے فارمیٹ: گلی کی اقسام مختصر شکلیں استعمال کرتی ہیں — Str.، Bd.، Al.، Cal. شہر اور کمیون کے نام مقامی اصولوں پر عمل کرتے ہیں۔ فرانسیسی یا جرمن پتوں کے لیے بنے Parsers یہاں خراب کارکردگی کرتے ہیں۔
نام کی تصریف: رومانیائی میں نام grammatical case کے حساب سے بدلتے ہیں۔ اسی شخص کا نام جملے کے مختلف حصوں میں مختلف نظر آتا ہے۔ NER ماڈلز کو دستاویز میں ناموں کو لنک کرنے کے لیے اسے سنبھالنا ہوگا۔
غیر مغربی اسکرپٹس میں زبان کے خلا شناخت کو کیسے متاثر کرتے ہیں اس کے لیے ہماری APAC PII detection guide دیکھیں۔
ANSPDCP کیسز کیسے سامنے آتے ہیں
ANSPDCP کیسز تین نمونے دکھاتے ہیں۔
BPO خلاف ورزی کیسز: مشترکہ فائلوں میں ملازم ID نمبر اور EU کسٹمر ڈیٹا بغیر انکرپشن کے موجود ہے۔ خراب لاگز کا مطلب ہے فرم یہ نہیں بتا سکتی کہ کون سے ریکارڈ تک رسائی ہوئی۔ اس سے تحقیقات طول پکڑتی ہے اور جرمانہ بڑھتا ہے۔
صحت کی نمائش: مریض فائلیں — قومی ID، صحت کارڈ ID، اور تشخیص — غلط شخص تک پہنچ جاتی ہیں۔ PII ٹول میں اس فارمیٹ کی حمایت نہیں تھی۔ ڈیٹا بغیر masking کے چلا گیا۔
بین الاقوامی ٹرانسفر کی ناکامیاں: ایک آؤٹ سورسنگ فرم شناخت سے جڑے ریکارڈ غیر EEA فریق کو بھیجتی ہے۔ کوئی Transfer Impact Assessment نہیں۔ کوئی Standard Contractual Clauses نہیں۔ ڈیٹا کی آرٹیکل 9 حیثیت ایک معمول کی خلا کو زیادہ سنگین خلاف ورزی میں بدل دیتی ہے۔
ANSPDCP تعمیل کے لیے تین کنٹرول
یہ تین کم از کم تکنیکی بنیاد بناتے ہیں:
- modulo-11 تصدیق کے ساتھ CNP شناخت — پیٹرن میچنگ اکیلی کافی نہیں۔
- ڈائیکریٹک-سے-واقف NER — UTF-8 اور Latin-2 دونوں ذرائع میں ș، ț، ă، â، اور î شامل کریں۔
- ID کارڈ شناخت — قومی کارڈ بہت سے دستاویز اقسام میں CNP کے ساتھ ظاہر ہوتا ہے۔
قومی IDs GDPR خطرہ کیسے پیدا کرتے ہیں اس کی وسیع تر نظر کے لیے، ہماری EU national tax ID detection guide دیکھیں۔