عندما لا يوجد خروج من الشبكة
تعمل عالمة بيانات في شركة دفاعية. لديها 3,000 سجل موظف. تحتاج إلى إزالة الأسماء وأرقام الضمان الاجتماعي ومستويات التصاريح الأمنية. ثم يمكنها مشاركة البيانات مع شريك بحثي بموجب اتفاقية CUI.
شبكتها لا تتصل بالإنترنت. بالتصميم.
تختبر كل أداة ويب يمكنها إيجادها. كل واحدة ترسل البيانات إلى خادم خارجي. كل منصة سحابية تحتاج حساباً ورابطاً نشطاً. حتى الأدوات "المحلية" غالباً ما تستدعي خادم ترخيص بعيداً.
هذه هي مشكلة النشر المعزول. تطال فرقاً أكثر مما يتوقع معظم الناس.
من يحتاج إزالة PII بدون اتصال
شركات الدفاع والوكالات الحكومية تواجه هذا الأمر في أغلب الأحيان. يتطلب برنامج FedRAMP التابع لـ DISA أن تبقى البيانات داخل حدود الشبكات المعتمدة. تُقيّد ITAR البيانات التقنية على أنظمة خاضعة للسيطرة الأمريكية. شبكات مثل JWICS وSIPRNet مُعزولة فيزيائياً بالتصميم.
لكن الحاجة للعمل بدون اتصال تتجاوز المواقع السرية:
المستشفيات ذات الشبكات المقسَّمة. أنظمة تصوير PACS ومنصات السجلات الصحية الإلكترونية وقواعد بيانات البحث غالباً ما تقع على شبكات بدون إنترنت بحكم السياسة.
قاعات التداول ومراكز المقاصة. أنظمة التداول الخاصة والأنظمة المتصلة بـ SWIFT تستخدم قطعاً صارماً للشبكات.
أنظمة التحكم الصناعية. شبكات SCADA والبنية التحتية الحيوية تعمل بعزل هوائي كإجراء أمني أساسي. جعل ذلك معيار ما بعد Stuxnet.
قواعد البيانات الأوروبية. تتطلب Landesdatenschutzgesetze الألمانية وقوانين أوروبية مماثلة المعالجة المحلية للسجلات الحكومية والصحية الحساسة. وصلت غرامة TikTok بـ 530 مليون يورو بموجب GDPR في مايو 2025. غطّت نقل البيانات إلى الصين. دفعت تلك الغرامة المزيد من الفرق نحو الأدوات المحلية. اطّلع على نظرة عامة على الامتثال لقواعد نقل GDPR المنطبقة.
لماذا تفشل أدوات السحابة في الشبكات المعزولة
معظم أدوات إزالة البيانات تتبع نموذج SaaS:
جهاز المستخدم → HTTPS → API المورّد → نماذج NLP → الاستجابة → جهاز المستخدم
هذا التصميم يحتاج وصولاً للإنترنت على جهاز المعالجة. ويحتاج ثقة في خوادم المورّد. ويعني عبور البيانات للشبكات الخارجية.
على شبكة معزولة، الخطوة الأولى مستحيلة فيزيائياً. للبيئات المنظَّمة، كل من الخطوتين الثانية إلى الرابعة قد تكسر قواعد الامتثال.
Presidio المستضاف ذاتياً هو الحل البديل الشائع. لكنه يحتاج مهارات Docker وإعداد Python. ويحتاج أيضاً تنزيلات نماذج spaCy التي تتطلب اتصالاً بالإنترنت. ويحتاج دعم تقنية معلومات مستمر. معظم الفرق تفتقر إلى كل هذا.
الفجوة بين سهولة السحابة وتعقيد الاستضافة الذاتية هي بالضبط ما تسده أدوات سطح المكتب المحلية.
كيف تعمل إزالة PII المحلية
أداة محلية جيدة تشحن مع كل ما تحتاجه:
نماذج NLP مُجمَّعة. نماذج spaCy (40–80 ميغابايت كل منها) ونماذج المحوّل لاكتشاف الكيانات المسمّاة تكون جزءاً من المثبّت. لا حاجة للتنزيل في وقت التشغيل.
خط أنابيب اكتشاف محلي. Regex وNLP والتعلم الآلي جميعها تعمل على المعالج المركزي المحلي — أو GPU إن كان متاحاً. محرك Presidio داخل anonym.legal لا يُجري أي استدعاءات شبكية أثناء التشغيل.
خزينة محلية مشفّرة. الإعدادات والإعدادات المسبقة والمفاتيح تُخزَّن محلياً. الخزينة تستخدم تشفير AES-256-GCM واشتقاق مفتاح Argon2id. لا مزامنة سحابية. لا نسخ احتياطية بعيدة. الخزينة تبقى على الجهاز.
إدخال/إخراج ملفات محلي. ملفات الإدخال تأتي من التخزين المحلي. ملفات الإخراج تعود للتخزين المحلي. لا بيانات تعبر أي واجهة شبكية.
سطح هجوم صغير. يستخدم تطبيق سطح المكتب Tauri 2.0 (قائم على Rust). يمتلك Tauri سطح هجوم أصغر بكثير من أدوات Electron (القائمة على Chromium). حجمه الثنائي أصغر بنحو عشرة أضعاف. ويستدعي أيضاً واجهات برمجة نظام التشغيل بشكل افتراضي أقل.
ثلاثة سيناريوهات امتثال حقيقية
مستندات ITAR — 500 ملف
تحتاج شركة دفاعية لمشاركة وثائق تقنية مع شريك أجنبي بموجب استثناء ترخيص. تحتوي الملفات على أسماء أشخاص أمريكيين وبيانات موظفين. يجب إزالة كلاهما أولاً.
الاحتياجات الرئيسية: المعالجة على محطات عمل مرخّصة فقط. لا بيانات تُرسل خارج الشبكة المرخّصة. سجل مراجعة يُثبت إنجاز العمل. دعم دفعي لـ 500+ ملف.
يتعامل تطبيق سطح المكتب مع جميع ملفات DOCX البالغة 500+ محلياً في وضع الدفعات. لا استدعاء شبكي يحدث أثناء التشغيل. يبقى سجل المراجعة في الخزينة المحلية. المخرجات تلبّي متطلبات استثناء ترخيص ITAR.
وكالة اتحادية ألمانية — سجلات الشكاوى
وكالة اتحادية ألمانية يجب عليها إزالة البيانات الشخصية من سجلات شكاوى المواطنين. ثم ترسل السجلات إلى معهد بحثي. يحظر توجيه BfDI معالجتها على أنظمة غير حكومية.
يعمل تطبيق سطح المكتب على محطات عمل Windows 11 الخاصة بالوكالة. جميع المعالجات محلية. يؤكد فريق أمان تقنية المعلومات ذلك بمراقبة حركة المرور — صفر اتصالات خارجية أثناء التشغيل.
بحث مستشفى — إخفاء هوية السجلات الصحية الإلكترونية
فريق بحث مستشفى يحتاج لتجريد سجلات المرضى لتجربة سريرية. يتطلب HIPAA Safe Harbor إزالة 18 نوعاً من المعرّفات. الشبكة السريرية لا تتصل بالإنترنت.
يتعامل تطبيق سطح المكتب مع المعالجة الدفعية لمصدّرات السجلات الصحية الإلكترونية بتنسيقَي CSV وJSON. يراجع مسؤول الخصوصية المخرجات مقابل قواعد Safe Harbor قبل ذهاب مجموعة البيانات لشركاء البحث.
ما تبحث عنه في أداة غير متصلة
| الإمكانية | لماذا مهمة |
|---|---|
| غير متصلة بالكامل بعد التثبيت | لا اعتماد على الإنترنت أثناء المعالجة |
| نماذج NLP مُجمَّعة | لا خطوة تنزيل مطلوبة |
| المعالجة الدفعية | التعامل مع أحجام كبيرة بدون عمل يدوي |
| خزينة محلية مشفّرة | تخزين آمن للإعدادات والمفاتيح |
| سجل مراجعة | السجلات المطلوبة لمراجعات الامتثال |
| دعم Windows وmacOS وLinux | يغطّي أنواع محطات العمل السرية |
| خيار بدون قياس عن بعد | إيقاف تسرّب البيانات عبر القياس عن بعد |
| دعم تنسيق الملفات | DOCX وPDF وTXT وCSV وJSON وExcel |
قواعد البيانات تدفع الفرق نحو الأدوات المحلية
أثارت غرامة TikTok بـ 530 مليون يورو موجة أوسع من الغرامات. الفرق الأوروبية التي استخدمت أدوات سحابية تطرح الآن سؤالاً جديداً. هل تستوفي المعالجة على خوادم المورّد الفصلَ الخامس من GDPR وقوانين البيانات الوطنية؟
الإجابة الأنظف على "أين تذهب بياناتك؟" هي: إلى لا مكان — لا تغادر الجهاز أبداً. المعالجة المحلية تُزيل سؤال نقل GDPR كلياً.
للفرق الألمانية، القراءة الصارمة للمواد 44–46 من DSGVO تجعل المعالجة المحلية خياراً حكيماً. ينطبق هذا حتى بدون قيود شبكية صارمة. يوضح نظرة عامة على الأمان لدينا كيف تُقصي المعالجة المحلية سلسلة البيانات من طرف ثالث.
ملاحظات النشر العملي
التثبيت على الأنظمة المعزولة. المثبّت — .exe أو .msi لـ Windows، .dmg لـ macOS، .AppImage أو .deb لـ Linux — ينقل إلى الشبكة المعزولة عبر USB أو نقل ملفات آمن. الإنترنت غير مطلوب بعد التثبيت.
دعم اللغات. 24 نموذجاً لغوياً مخصصاً تُشحن مع التطبيق. المجموعة الكاملة متاحة بدون اتصال بدون تنزيل إضافي.
متطلبات الأجهزة. يعمل خط أنابيب NLP على محطات العمل الحديثة بدون GPU. المعالجة الدفعية لـ 1,000 مستند تستغرق عادةً 5–15 دقيقة. السرعة تعتمد على حجم المستند وسرعة المعالج.
إعداد الترخيص بدون اتصال. للشبكات التي لا يمكن فيها الوصول لخادم الترخيص، يتوفر إعداد الترخيص بدون اتصال.
متى لا يكون العزل الهوائي الخيار المناسب
أنظمة العزل الهوائي تحل مشاكل محددة. كما تُضيف عبئاً حقيقياً.
صعوبة التحديث. إبقاء النماذج والبرامج حديثة يتطلب خطوات يدوية. الفرق التي تتأخر قد تفوّت أنماط PII الجديدة.
تكاليف الربط. لا يمكن للأنظمة المعزولة الاتصال بأدوات SIEM السحابية أو لوحات تدقيق بعيدة. تُحتاج حلول ثنائية البيانات المخصصة. هذا يرفع التكاليف.
مقايضات الدقة. الأدوات السحابية تُحدّث بيانات التدريب باستمرار. النماذج غير المتصلة هي لقطة. يمكن أن تتأخر في مواجهة أنماط اللغة الجديدة بمرور الوقت.
غير ضروري لكل نموذج تهديد. الفرق بدون تفويضات حكومية أو صحية أو قانونية قد تجد الأدوات السحابية أكثر عملية. التشفير القوي وعمليات تدقيق SOC 2 من النوع الثاني واتفاقيات معالجة البيانات تغطّي معظم الحالات. العزل الهوائي يؤتي ثماره فقط عندما يشمل نموذج التهديد حقاً السرقة القائمة على الشبكة من خصم ماهر.
بالنسبة لمعظم الشركات الصغيرة والمتوسطة والفرق المؤسسية القياسية، يوفّر التشفير القوي أثناء النقل والراحة حماية كافية. أضف ضوابط تعاقدية قوية وتغطّي معظم حالات الاستخدام — بدون عبء العزل الهوائي الكامل. اطّلع على الأسئلة الشائعة لمزيد من المعلومات حول اختيار نموذج النشر الصحيح.
يعالج تطبيق سطح المكتب الخاص بـ anonym.legal (Windows وmacOS وLinux) بيانات PII بالكامل محلياً مع نماذج NLP مُجمَّعة. لا اتصال إنترنت مطلوب بعد التثبيت. تدعم المعالجة الدفعية 1–5,000 ملف لكل تشغيل حسب طبقة الخطة.