GDPR ڈیٹا کمی: ریئل ٹائم API
2026 کے لیے اپ ڈیٹ کیا گیا
GDPR آرٹیکل 5(1)(c) کہتا ہے صرف وہی جمع کریں جو آپ کو چاہیے۔ یہ ڈیٹا کمی کا قانون ہے۔ زیادہ تر ٹیمیں اسے فارم ڈیزائن کے ذریعے توڑتی ہیں، بُری نیت سے نہیں۔ فری ٹیکسٹ فیلڈز ناموں، پتوں، اور ID نمبروں کو کھینچتے ہیں جن کی کسی نے منصوبہ بندی نہیں کی تھی۔
ڈیٹا بیس کو بعد میں صاف کرنا اسے ٹھیک نہیں کرتا۔ خلاف ورزی اس وقت ہوئی جب آپ نے ڈیٹا جمع کیا۔ اسے ماخذ پر روکنا واحد حقیقی حل ہے۔ فارم جمع کرنے پر ریئل ٹائم API چیک ضرورت سے زیادہ جمع کو شروع ہونے سے پہلے روکتی ہے۔
ہماری تعمیل کا جائزہ اور سیکیورٹی طریقہ کار دیکھیں۔
فارم ضرورت سے زیادہ کیوں جمع کرتے ہیں
ویب ایپس میں فری ٹیکسٹ فیلڈز PII جمع کرتے ہیں جس کی کسی نے منصوبہ بندی نہیں کی:
- سپورٹ ٹکٹ "وجہ" فیلڈز طبی تاریخوں اور انشورنس نمبروں سے بھرے
- سروے "دیگر تبصرے" حصوں میں مکمل نام اور فون نمبر
- HR "نوٹس" کالموں میں سالوں کی غیر منظم ذاتی تفصیلات
- آرڈر "نوٹس" فیلڈز میں گاہک ID نمبر
کمی کے قانون کا تقاضا ہے کہ یہ PII کبھی آپ کے سسٹمز میں نہ آئے۔ بعد از واقعہ صفائی علامت کا علاج کرتی ہے۔ ریئل ٹائم ڈیٹیکشن وجہ کو ہٹاتی ہے۔
بعد از واقعہ صفائی کیوں ناکافی ہے
محفوظ PII کو صاف کرنے والی ٹیموں کو چار مسائل کا سامنا ہے۔
مکمل نہیں۔ پیٹرن میچنگ واضح PII ڈھونڈتی ہے۔ یہ سیاق و سباق پر مبنی حوالے چھوڑتی ہے۔ "میری بہن Sophie کو بھی یہی مسئلہ تھا" میں ایک نام ہے جسے اکثر اسکین چھوڑ دیتے ہیں۔
قانونی وقت۔ خلاف ورزی جمع کرنے پر ہوتی ہے۔ مہینوں بعد ڈیٹا صاف کرنا اسے ٹھیک نہیں کرتا۔
نامکمل حذف۔ ڈیٹا بیس بیک اپ ہوتے ہیں۔ سسٹم لاگ لکھتے ہیں۔ اینالیٹکس ٹولز ڈیٹا ایکسپورٹ کرتے ہیں۔
خلاف ورزی کا ایکسپوژر۔ جمع کرنے اور صاف کرنے کے درمیان، اضافی PII آپ کے سسٹمز میں بیٹھتی ہے۔
ماخذ پر جمع کو روکنا چاروں کو حل کرتا ہے۔
فارم ویلیڈیشن کے لیے ڈیٹیکشن پیٹرن
فارم میں ریئل ٹائم PII ڈیٹیکشن شامل کرنے کے تین طریقے ہیں۔
کلائنٹ سائیڈ (Chrome Extension)۔ Extension براؤزر فیلڈز میں paste events دیکھتا ہے۔ جب صارف PII کے ساتھ متن پیسٹ کرتا ہے، یہ فوری طور پر اداروں کو نمایاں کرتا ہے۔ صارف جمع کرنے سے پہلے انہیں ہٹاتا ہے۔ کوئی API کال نہیں — ڈیٹیکشن مقامی طور پر چلتی ہے۔
سرور سائیڈ (API انٹیگریشن)۔ فارم آپ کے سرور کو پوسٹ کرتا ہے۔ ڈیٹا بیس لکھنے سے پہلے، آپ کا کوڈ ڈیٹیکشن API کو کال کرتا ہے۔ API اعتماد اسکور کے ساتھ ادارے کی اقسام واپس کرتا ہے۔ اعلیٰ اعتماد مطابقت جمع کو واضح پیغام کے ساتھ بلاک کرتی ہے۔ درمیانی اعتماد مطابقت جائزے کے قدم کا اشارہ دیتی ہے۔
ہائبرڈ (تجویز کردہ)۔ کلائنٹ سائیڈ ہائی لائٹنگ صارفین کو تیز فیڈ بیک دیتی ہے۔ سرور سائیڈ چیکس تعمیل کی ضمانت فراہم کرتی ہیں۔ عام سوالات کے لیے FAQ دیکھیں۔
مثال: صحت کا مریض پورٹل
ایک مریض پورٹل مریضوں کو بکنگ سے پہلے اپنی علامات مفت متن فیلڈ میں بیان کرنے دیتا ہے۔ فیلڈ باقاعدگی سے دوسرے مریضوں کے نام، ID نمبر، اور گھر کے پتے شامل اندراجات وصول کرتی ہے۔
ریئل ٹائم ڈیٹیکشن سے پہلے:
- علامات فیلڈ میں PII: تقریباً 12% جمع کاری
- صفائی کا طریقہ: ہفتہ وار بیچ پروسیس
- تعمیلی حیثیت: رد عمل — آرٹیکل 5(1)(c) کی خلاف ورزی جمع کرنے پر ہوئی
API انٹیگریشن کے بعد:
- API ڈیٹا بیس میں کسی بھی لکھنے سے پہلے اعلیٰ اعتماد PII کا پتہ لگاتا ہے
- مریض دیکھتا ہے: "آپ کے پیغام میں ذاتی معلومات لگتی ہیں۔ جمع کرنے سے پہلے براہ کرم انہیں ہٹائیں۔"
- مریض نظرثانی کرتا ہے اور دوبارہ جمع کرتا ہے
- ڈیٹا بیس صرف علامات کی تفصیل وصول کرتا ہے
اس منظرنامے میں، فیلڈ میں PII تقریباً 12% سے 1% سے کم جمع کاری پر گر گئی۔
AI ٹولز اور ڈیٹا کمی
سپورٹ ایجنٹ اکثر گاہک ای میلز کو AI ڈرافٹنگ ٹولز میں پیسٹ کرتے ہیں۔ وہ ای میلز نام، پتے، اور اکاؤنٹ نمبر رکھ سکتی ہیں۔ اسے AI ماڈل کو بھیجنا ضرورت سے زیادہ ہو سکتا ہے۔
MCP Server متن ماڈل تک پہنچنے سے پہلے ایک ڈیٹیکشن قدم شامل کرتا ہے۔ گاہکوں کے نام [CUSTOMER] بن جاتے ہیں۔ مخصوص تفصیلات صاف ہو جاتی ہیں۔ AI صاف متن کا استعمال کرتے ہوئے جواب ڈرافٹ کرتا ہے۔ ایجنٹ صرف وہی واپس شامل کرتا ہے جو جواب کو چاہیے۔
یہ AI استعمال کے لیے ڈیٹا کمی کے قانون کو پورا کرتا ہے۔ ماڈل کو صرف وہی ملتا ہے جو ضروری ہے — جو عام طور پر کوئی PII نہیں ہوتا۔ اداروں کی مکمل فہرست کے لیے دیکھیں۔