جب نیٹ ورک میں کوئی راستہ نہ ہو
ایک ڈیفنس فرم میں ڈیٹا سائنٹسٹ کام کرتی ہیں۔ ان کے پاس 3,000 پرسنل ریکارڈز ہیں۔ انہیں نام، سوشل سیکیورٹی نمبر، اور کلیئرنس لیولز ہٹانے ہیں۔ پھر وہ CUI معاہدے کے تحت ڈیٹا ریسرچ پارٹنر کے ساتھ شیئر کر سکتی ہیں۔
ان کے نیٹ ورک میں انٹرنیٹ نہیں ہے۔ ڈیزائن کے ذریعے۔
وہ ہر ویب-بیسڈ ٹول آزماتی ہیں۔ ہر ایک باہری سرور کو ڈیٹا بھیجتا ہے۔ ہر کلاؤڈ پلیٹ فارم کو اکاؤنٹ اور لائیو لنک چاہیے۔ یہاں تک کہ "آن-پریمیسز" ٹولز اکثر ریموٹ لائسنس سرور کو کال کرتے ہیں۔
یہ ایئر-گیپڈ ڈیپلائمنٹ کا مسئلہ ہے۔ یہ زیادہ ٹیموں کو متاثر کرتا ہے جتنا زیادہ تر لوگ سوچتے ہیں۔
آف لائن PII ریموول کی ضرورت کسے ہے
ڈیفنس فرمز اور سرکاری ایجنسیاں اس کا سب سے زیادہ سامنا کرتی ہیں۔ DISA کا FedRAMP پروگرام ڈیٹا کو منظور شدہ نیٹ ورک حدود کے اندر رکھنے کا تقاضہ کرتا ہے۔ ITAR تکنیکی ڈیٹا کو US-کنٹرولڈ سسٹمز تک محدود کرتا ہے۔ JWICS اور SIPRNet جیسے نیٹ ورک ڈیزائن کے ذریعے جسمانی طور پر کٹے ہوئے ہیں۔
لیکن آف لائن کی ضرورت خفیہ سائٹس سے کہیں آگے جاتی ہے:
سیگمنٹڈ نیٹ ورکس والے ہسپتال۔ PACS امیجنگ سسٹمز، EHR پلیٹ فارمز، اور ریسرچ ڈیٹا بیسز اکثر پالیسی کے ذریعے بغیر انٹرنیٹ کے نیٹ ورکس پر ہوتے ہیں۔
ٹریڈنگ فلورز اور کلیئرنگ ہاؤسز۔ پروپرائٹری ٹریڈنگ سسٹمز اور SWIFT سے منسلک سسٹمز سخت نیٹ ورک کٹ آف استعمال کرتے ہیں۔
انڈسٹریل کنٹرول سسٹمز۔ SCADA نیٹ ورکس اور کریٹیکل انفراسٹرکچر ایئر گیپس کے ساتھ ایک بنیادی سیکیورٹی اقدام کے طور پر چلتے ہیں۔ Stuxnet کے بعد سخت ہونے نے اسے معیار بنا دیا۔
یورپی ڈیٹا قوانین۔ جرمنی کے Landesdatenschutzgesetze اور اسی طرح کے EU قوانین حساس سرکاری اور صحت کے ریکارڈز کے لیے مقامی ڈیٹا پروسیسنگ کی ضرورت ہے۔ TikTok کا €530M GDPR جرمانہ مئی 2025 میں آیا۔ اس نے چین کو ڈیٹا ٹرانسفر کو کور کیا۔ اس جرمانے نے مزید ٹیموں کو مقامی ٹولز کی طرف دھکیلا۔ لاگو GDPR ٹرانسفر قوانین کے لیے ہماری کمپلائنس کا جائزہ دیکھیں۔
کلاؤڈ ٹولز ایئر-گیپڈ نیٹ ورکس میں کیوں ناکام ہوتے ہیں
زیادہ تر ڈیٹا ریموول ٹولز SaaS ماڈل فالو کرتے ہیں:
User Device → HTTPS → Vendor API → NLP Models → Response → User Device
اس ڈیزائن کو پروسیسنگ ڈیوائس پر انٹرنیٹ رسائی چاہیے۔ وینڈر کے سرورز پر بھروسے کی ضرورت ہے۔ اس کا مطلب ہے کہ ڈیٹا بیرونی نیٹ ورکس سے گزرتا ہے۔
ایئر-گیپڈ نیٹ ورک پر، پہلا قدم ایک جسمانی ناممکنیت ہے۔ ریگولیٹڈ ماحول کے لیے، مرحلہ دو سے چار میں سے ہر ایک کمپلائنس قوانین توڑ سکتا ہے۔
سیلف-ہوسٹڈ Presidio عام متبادل ہے۔ لیکن اسے Docker مہارت اور Python سیٹ اپ چاہیے۔ اسے spaCy ماڈل ڈاؤن لوڈ بھی چاہیے، جن کے لیے انٹرنیٹ رسائی درکار ہے۔ اور اسے جاری IT سپورٹ چاہیے۔ زیادہ تر ٹیموں میں یہ سب نہیں ہوتا۔
کلاؤڈ کی آسانی اور سیلف-ہوسٹڈ کی پیچیدگی کے درمیان خلاء بالکل وہی ہے جسے مقامی ڈیسک ٹاپ ٹولز پُر کرتے ہیں۔
مقامی PII ریموول کیسے کام کرتا ہے
ایک اچھا آف لائن ٹول اپنی ضرورت کی ہر چیز کے ساتھ آتا ہے:
بنڈلڈ NLP ماڈلز۔ spaCy ماڈلز (40-80 MB ہر ایک) اور نامی ادارہ کا پتہ لگانے کے لیے ٹرانسفارمر ماڈلز انسٹالر کا حصہ ہیں۔ رن ٹائم پر کوئی ڈاؤن لوڈ درکار نہیں۔
مقامی ڈیٹیکشن پائپ لائن۔ Regex، NLP، اور ML سب مقامی CPU پر چلتے ہیں — یا GPU اگر دستیاب ہو۔ anonym.legal کے اندر Presidio-بیسڈ انجن رن کے دوران کوئی نیٹ ورک کال نہیں کرتا۔
انکرپٹڈ مقامی والٹ۔ کنفیگز، پریسیٹس، اور چابیاں مقامی طور پر اسٹور ہیں۔ والٹ AES-256-GCM انکرپشن اور Argon2id کی ڈیریویشن استعمال کرتا ہے۔ کوئی کلاؤڈ سنک نہیں۔ کوئی ریموٹ بیک اپ نہیں۔ والٹ ڈیوائس پر رہتا ہے۔
مقامی فائل I/O۔ ان پٹ فائلیں مقامی اسٹوریج سے آتی ہیں۔ آؤٹ پٹ فائلیں مقامی اسٹوریج میں واپس جاتی ہیں۔ کوئی ڈیٹا کسی نیٹ ورک انٹرفیس کو نہیں عبور کرتا۔
چھوٹی اٹیک سرفیس۔ ڈیسک ٹاپ ایپ Tauri 2.0 (Rust-بیسڈ) استعمال کرتی ہے۔ Tauri کی اٹیک سرفیس Electron (Chromium-بیسڈ) ٹولز سے بہت چھوٹی ہے۔ اس کی بائنری تقریباً ایک-دسویں سائز کی ہے۔ یہ بطور ڈیفالٹ کم OS APIs بھی کال کرتا ہے۔
تین حقیقی کمپلائنس منظرنامے
ITAR دستاویزات — 500 فائلیں
ایک ڈیفنس فرم کو لائسنس استثنیٰ کے تحت غیر ملکی پارٹنر کے ساتھ تکنیکی دستاویزات شیئر کرنی ہیں۔ فائلوں میں US افراد کے نام اور پرسنل ڈیٹا ہے۔ دونوں پہلے ہٹانے ہوں گے۔
اہم ضروریات: صرف کلیئرڈ ورک اسٹیشنز پر پروسیسنگ۔ کلیئرڈ نیٹ ورک سے باہر کوئی ڈیٹا نہیں جانا۔ یہ دکھانے والا آڈٹ ٹریل کہ کام ہوا۔ 500+ فائلوں کے لیے بیچ سپورٹ۔
ڈیسک ٹاپ ایپ تمام 500+ DOCX فائلوں کو مقامی طور پر بیچ موڈ میں ہینڈل کرتی ہے۔ رن کے دوران کوئی نیٹ ورک کال نہیں ہوتی۔ آڈٹ لاگ مقامی والٹ میں رہتا ہے۔ آؤٹ پٹ ITAR لائسنس استثنیٰ کی ضروریات پوری کرتا ہے۔
جرمن فیڈرل ایجنسی — شکایتی ریکارڈز
ایک جرمن فیڈرل ایجنسی کو شہری شکایتی ریکارڈز سے ذاتی ڈیٹا ہٹانا ہے۔ پھر وہ ریکارڈز ریسرچ انسٹیٹیوٹ کو بھیجتی ہے۔ BfDI رہنمائی غیر سرکاری سسٹمز پر پروسیسنگ سے روکتی ہے۔
ڈیسک ٹاپ ایپ ایجنسی کے Windows 11 ورک اسٹیشنز پر چلتی ہے۔ تمام پروسیسنگ مقامی ہے۔ IT سیکیورٹی ٹیم ٹریفک مانیٹرنگ سے اس کی تصدیق کرتی ہے — رن کے دوران صفر بیرونی کنکشن۔
ہسپتال ریسرچ — EHR ڈی-آئی ڈی
ایک ہسپتال ریسرچ ٹیم کو کلینیکل ٹرائل کے لیے مریض ریکارڈز سے ڈیٹا ہٹانا ہے۔ HIPAA سیف ہاربر 18 شناختی اقسام کو ہٹانے کی ضرورت ہے۔ کلینیکل نیٹ ورک میں انٹرنیٹ رسائی نہیں ہے۔
ڈیسک ٹاپ ایپ CSV اور JSON فارمیٹ میں EHR ایکسپورٹس کی بیچ پروسیسنگ ہینڈل کرتی ہے۔ پرائیویسی آفیسر ریسرچ پارٹنرز کو ڈیٹا سیٹ جانے سے پہلے سیف ہاربر قوانین کے خلاف آؤٹ پٹ کا جائزہ لیتا ہے۔
آف لائن ٹول میں کیا دیکھیں
| صلاحیت | کیوں اہمیت رکھتی ہے |
|---|---|
| انسٹال کے بعد مکمل طور پر آف لائن | پروسیسنگ کے دوران انٹرنیٹ کی کوئی ضرورت نہیں |
| بنڈلڈ NLP ماڈلز | کوئی ڈاؤن لوڈ قدم درکار نہیں |
| بیچ پروسیسنگ | دستی کام کے بغیر بڑے والیوم ہینڈل کریں |
| مقامی انکرپٹڈ والٹ | کنفیگز اور چابیوں کا محفوظ اسٹوریج |
| آڈٹ لاگ | کمپلائنس جائزوں کے لیے درکار ریکارڈز |
| Windows، macOS، Linux سپورٹ | خفیہ ورک اسٹیشن اقسام کا احاطہ کرتا ہے |
| کوئی ٹیلی میٹری آپشن نہیں | ٹیلی میٹری کے ذریعے ڈیٹا جانے سے روکیں |
| فائل فارمیٹ سپورٹ | DOCX، PDF، TXT، CSV، JSON، Excel |
ڈیٹا قوانین ٹیموں کو مقامی ٹولز کی طرف دھکیلتے ہیں
TikTok کے €530M جرمانے نے جرمانوں کی وسیع لہر شروع کی۔ EU ٹیمیں جو کلاؤڈ ٹولز استعمال کرتی تھیں اب ایک نیا سوال پوچھتی ہیں۔ کیا وینڈر کے سرورز پر پروسیسنگ GDPR چیپٹر V اور قومی ڈیٹا قوانین کو پورا کرتی ہے؟
"آپ کا ڈیٹا کہاں جاتا ہے؟" کا سب سے صاف جواب یہ ہے: کہیں نہیں — یہ کبھی ڈیوائس نہیں چھوڑتا۔ مقامی پروسیسنگ GDPR ٹرانسفر سوال کو مکمل طور پر ختم کر دیتی ہے۔
جرمن ٹیموں کے لیے، DSGVO کی آرٹیکل 44-46 کی سخت تشریح مقامی پروسیسنگ کو ایک ذہین انتخاب بناتی ہے۔ یہ سخت نیٹ ورک پابندیوں کے بغیر بھی لاگو ہوتا ہے۔ ہماری سیکیورٹی کا جائزہ بتاتا ہے کہ مقامی پروسیسنگ تھرڈ-پارٹی ڈیٹا چین کو کیسے ختم کرتی ہے۔
عملی ڈیپلائمنٹ نوٹس
ایئر-گیپڈ سسٹمز پر انسٹال کریں۔ انسٹالر — Windows .exe یا .msi، macOS .dmg، Linux .AppImage یا .deb — USB یا محفوظ فائل ٹرانسفر کے ذریعے ایئر-گیپڈ نیٹ ورک میں منتقل ہوتا ہے۔ انسٹال کے بعد انٹرنیٹ درکار نہیں۔
زبان کی سپورٹ۔ 24 زبان-مخصوص ماڈلز ایپ کے ساتھ آتے ہیں۔ بغیر کسی اضافی ڈاؤن لوڈ کے پورا سیٹ آف لائن دستیاب ہے۔
ہارڈویئر کی ضروریات۔ NLP پائپ لائن GPU کے بغیر جدید ورک اسٹیشنز پر چلتی ہے۔ 1,000 دستاویزات کی بیچ پروسیسنگ عام طور پر 5-15 منٹ لیتی ہے۔ رفتار دستاویز کے سائز اور CPU کی رفتار پر منحصر ہے۔
آف لائن لائسنس سیٹ اپ۔ ایسے نیٹ ورکس کے لیے جہاں لائسنس سرور تک پہنچنا ممکن نہیں، آف لائن لائسنس سیٹ اپ دستیاب ہے۔
جب ایئر-گیپنگ درست انتخاب نہیں
ایئر-گیپڈ سسٹمز مخصوص مسائل حل کرتے ہیں۔ یہ حقیقی بوجھ بھی ڈالتے ہیں۔
اپ ڈیٹ کی رگڑ۔ ماڈلز اور سافٹ ویئر کو موجودہ رکھنے کے لیے دستی اقدامات درکار ہیں۔ جو ٹیمیں پیچھے رہ جاتی ہیں وہ نئے PII پیٹرنز سے محروم ہو سکتی ہیں۔
لنکنگ اوور ہیڈ۔ ایئر-گیپڈ سسٹمز کلاؤڈ SIEM ٹولز یا ریموٹ آڈٹ ڈیش بورڈز سے نہیں جڑ سکتے۔ کسٹم ڈیٹا-ڈائیوڈ حل درکار ہیں۔ اس سے اخراجات بڑھتے ہیں۔
درستگی کے معاوضے۔ کلاؤڈ ٹولز جاری بنیادوں پر ٹریننگ ڈیٹا اپ ڈیٹ کرتے ہیں۔ آف لائن ماڈلز ایک اسنیپ شاٹ ہیں۔ وہ وقت کے ساتھ نئے زبان کے پیٹرنز سے پیچھے رہ سکتے ہیں۔
ہر تھریٹ ماڈل کے لیے درکار نہیں۔ سرکاری، صحت، یا قانونی مینڈیٹ کے بغیر ٹیمیں کلاؤڈ ٹولز کو زیادہ عملی پا سکتی ہیں۔ مضبوط انکرپشن، SOC 2 Type II آڈٹس، اور ڈیٹا پروسیسنگ معاہدے زیادہ تر معاملات کو کور کرتے ہیں۔ ایئر-گیپنگ صرف اسی وقت فائدہ دیتی ہے جب تھریٹ ماڈل واقعی کسی ماہر مخالف کی طرف سے نیٹ ورک-بیسڈ ڈیٹا چوری کو شامل کرتا ہو۔
زیادہ تر SMBs اور معیاری انٹرپرائز ٹیموں کے لیے، ٹرانزٹ اور ریسٹ میں مضبوط انکرپشن کافی تحفظ دیتی ہے۔ مضبوط معاہداتی کنٹرول شامل کریں اور آپ زیادہ تر استعمال کے معاملات کو کور کرتے ہیں — مکمل ایئر-گیپنگ کے اوور ہیڈ کے بغیر۔ درست ڈیپلائمنٹ ماڈل چننے کے بارے میں مزید کے لیے ہمارا FAQ دیکھیں۔
anonym.legal کی ڈیسک ٹاپ ایپ (Windows، macOS، Linux) بنڈلڈ NLP ماڈلز کے ساتھ PII کو مکمل طور پر مقامی طور پر پروسیس کرتی ہے۔ انسٹالیشن کے بعد کوئی انٹرنیٹ کنکشن درکار نہیں۔ بیچ پروسیسنگ پلان ٹیئر کے لحاظ سے فی رن 1-5,000 فائلوں کو سپورٹ کرتی ہے۔