العودة إلى المدونةتقني

التكلفة الحقيقية لاكتشاف المعلومات الشخصية المفتوحة...

يتطلب استضافة Presidio الذاتية من 40 إلى 80 ساعة لإعدادها الأولي و5 إلى 10 ساعات شهريًا للصيانة المستمرة.

April 21, 20267 دقيقة قراءة
Presidio TCOopen-source costmanaged SaaSPII infrastructureDevOps cost

التكلفة الحقيقية لاكتشاف المعلومات الشخصية المفتوحة المصدر "المجانية": لماذا تكلف Presidio أكثر من 13,000 يورو سنويًا

"إنها مجانية" ليست تحليلًا للتكلفة الإجمالية للملكية. إنها تكلفة الترخيص - أحد المكونات العديدة.

Microsoft Presidio مجاني للتنزيل، مفتوح المصدر، ومدعوم من Microsoft. تكلفة البرنامج: 0 يورو. تكلفة البنية التحتية والهندسة والصيانة لنشر جاهز للإنتاج: 13,200 يورو+/سنة للفرق التي لديها موارد هندسية كبيرة. المزيد للفرق التي لا تمتلكها.

ما يتطلبه نشر Presidio للإنتاج فعليًا

الإعداد الأولي (40-80 ساعة هندسية):

تكوين بيئة Docker والشبكات: 4-8 ساعات. تتطلب بنية Presidio تنسيق عدة حاويات (خدمة التحليل، خدمة التعتيم، محرر الصور الاختياري). تكوين الشبكة بين الحاويات ليس بسيطًا وغالبًا ما يتم توثيقه كنقطة فشل في مشكلات GitHub.

إدارة بيئة Python: 2-4 ساعات. تتطلب spaCy وpresidio-analyzer وpresidio-anonymizer واحتياجاتهم التبعية المعقدة متطلبات توافق إصدار معقدة. يظهر GitHub مئات من المشكلات المفتوحة المتعلقة بصراعات التبعية، لا سيما بين إصدارات نموذج spaCy وتوافق Python 3.8/3.9/3.10.

تنزيلات وإدارة نماذج اللغة: 2-4 ساعات. تتراوح نماذج لغة spaCy من 300 ميجابايت إلى 1.4 جيجابايت لكل منها. يتطلب نشر يدعم 5 لغات من 1.5 إلى 7 جيجابايت من تخزين النموذج، وتكوين تحميل مناسب، وتخصيص الذاكرة. تعتبر فشل تحميل النموذج واحدة من أكثر مشكلات دعم Presidio شيوعًا.

تطوير مُعرّف مخصص: 8-16 ساعة. تغطي مجموعة مُعرّفات Presidio الافتراضية حوالي 40 نوعًا من الكيانات تركز على المعرفات الأمريكية. تحتاج النشر في الاتحاد الأوروبي إلى المعرفات الوطنية الأوروبية. تحتاج النشر في الرعاية الصحية إلى تنسيقات أرقام السجلات الطبية. يتطلب كل مُعرّف مخصص تنفيذ Python PatternRecognizer، وتسجيل YAML، واختبار.

تكوين API واختباره: 4-8 ساعات. يتضمن تكوين API الإنتاج إعدادات المهلة، والمصادقة، وتحديد معدل الاستخدام، والتسجيل. وثائق هذه التكوينات نادرة؛ تستمد معظم الفرق منها من مناقشات مشكلات GitHub.

تسجيل تدقيق الامتثال: 4-8 ساعات. يتطلب GDPR سجلات معالجة قابلة للإثبات. لا يتضمن Presidio تسجيل التدقيق بشكل افتراضي - يجب إضافته كطبقة وسيطة مخصصة.

توثيق الفريق والتوجيه: 4-8 ساعات.

إجمالي الإعداد الأولي: 28-52 ساعة بسعر 100 يورو/ساعة = 2,800-5,200 يورو

الصيانة السنوية (60-120 ساعة/سنة):

تقوم Presidio بإصدار تحديثات من 2 إلى 4 مرات في السنة. تتضمن تحديثات الإصدارات الرئيسية (Presidio 2.x) تغييرات كبيرة في واجهة برمجة التطبيقات تتطلب إعادة اختبار كبيرة. يتطلب الحفاظ على نشر الإنتاج تتبع الإصدارات، وتقييم التغييرات، والاختبار في بيئة staging، ونشر التحديثات.

تحديثات نماذج spaCy: يتم إصدار تحسينات نماذج اللغة بشكل دوري. يتطلب التحديث إعادة تنزيل النماذج، واختبار تغييرات دقة الكشف، وإعادة النشر.

حل صراعات التبعية: تعتبر صراعات التبعية في نظام Python البيئي عبئًا مستمرًا للصيانة. قد تتعارض المتطلبات التي تعمل اليوم مع تصحيحات الأمان التي يتم إصدارها الشهر المقبل.

المراقبة التشغيلية: مراقبة صحة الحاويات، والتحقق من توفر واجهة برمجة التطبيقات، واكتشاف تسرب الذاكرة (نماذج spaCy تستهلك الذاكرة بشكل مكثف)، وإجراءات إعادة التشغيل.

إجمالي الصيانة السنوية: 60-120 ساعة بسعر 100 يورو/ساعة = 6,000-12,000 يورو

دراسة حالة شركة التأمين

بدأ فريق الامتثال في شركة تأمين نشر Presidio لمعالجة مستندات المطالبات. كان لدى الفريق مهندسان بيانات مبتدئان ولا يوجد DevOps مخصص.

الأسبوع 1: مشكلة في شبكة Docker مع بنية الحاويات المتعددة. خدمات المحلل والمعتّم غير قادرة على التواصل. تم حلها بعد 3 أيام بمساعدة من مشكلات GitHub.

الأسبوع 2: فشل تحميل نموذج spaCy في بيئة الإنتاج (تكوين ذاكرة مختلف عن التطوير). 2 يومًا للتشخيص، ويوم واحد للحل.

الأسبوع 3: مُعرّف مخصص لتنسيق رقم التأمين الوطني البريطاني (NINO). عمل النمط في الاختبار ولكنه أنتج إيجابيات خاطئة في مستندات الإنتاج. 2 يومًا إضافيًا من الضبط.

الأسبوع 4: تم تصعيد المشروع. استهلكت فترة النشر المقدرة بـ 4 أسابيع 3 أسابيع هندسية ولم تكن جاهزة للإنتاج.

تقييم بديل: تم إنشاء حساب anonym.legal. تم تعتيم المستند الأول: 12 دقيقة بعد التسجيل. كشف NINO البريطاني: مدرج في مكتبة الكيانات الافتراضية. لا يتطلب أي تكوين.

القرار: تم اعتماد خطة anonym.legal Professional بسعر 180 يورو/سنة.

مقارنة التكلفة الإجمالية للملكية لهذه المنظمة:

  • تقدير نشر Presidio للإنتاج: 2-4 أسابيع إضافية = 40-80 ساعة هندسية = 4,000-8,000 يورو

  • صيانة Presidio السنوية (بدون DevOps مخصص): خارجية = 6,000-12,000 يورو/سنة

  • إجمالي السنة الأولى: 10,000-20,000 يورو

  • anonym.legal Professional: 180 يورو/سنة

  • الوقت الهندسي للنشر: 12 دقيقة (غير ملحوظ)

  • إجمالي السنة الأولى: 180 يورو

الوقت الهندسي الموفر مقابل إدارة Presidio المستضاف ذاتيًا: 60 ساعة إعداد أولي + 72 ساعة/سنة صيانة = حوالي 132 ساعة سنويًا بسعر 100 يورو/ساعة = 13,200 يورو موفرة مقابل تكلفة 180 يورو.

متى يكون استضافة Presidio ذاتيًا منطقيًا

تحليل التكلفة الإجمالية للملكية يفضل SaaS المدارة لمعظم المنظمات. يكون استضافة الذات مناسبة عندما:

متطلبات سيادة البيانات: متطلبات تنظيمية أو تعاقدية تحظر نقل البيانات إلى الخوادم الخارجية. ملاحظة: يوفر تطبيق anonym.legal Desktop (anonym.plus) معالجة غير متصلة بالإنترنت، مع الحفاظ على دقة بمستوى Presidio دون مغادرة البيانات للبيئة المحلية - مما يلبي هذه المتطلبات بتكلفة إجمالية أقل من Presidio المستضاف ذاتيًا.

حجم معالجة كبير: ملايين من استدعاءات واجهة برمجة التطبيقات يوميًا حيث تتجاوز تكلفة الطلب الواحد تكلفة البنية التحتية. عند هذا الحجم، يكون الاستثمار في البنية التحتية مبررًا من خلال اقتصاديات الحجم.

تخصيص عميق: المنظمات التي تبني اكتشاف المعلومات الشخصية في منتج بمتطلبات لا تتناسب مع مكتبة الكيانات أو تصميم واجهة برمجة التطبيقات للخدمة المدارة. يعتبر تطوير مُعرّف مخصص على Presidio مناسبًا هنا.

البنية التحتية الحالية لـ DevOps: المنظمات التي لديها هندسة منصة مخصصة تعالج Presidio كواحدة من العديد من الخدمات المدارة. تكون التكلفة الهامشية أقل عندما تكون إدارة البنية التحتية بالفعل تكلفة غارقة.

بالنسبة لـ 95% الأخرى من المنظمات - الفرق التي لا تمتلك DevOps مخصص، وأقسام الامتثال التي تحتاج إلى أدوات يمكن لموظفيها غير الفنيين استخدامها، والشركات الناشئة التي تحتاج إلى الامتثال قبل أن يكون لديها مهندسو بنية تحتية - فإن تكلفة الخدمة المدارة هي بشكل ساحق مواتية.

الخاتمة

تحتوي الأدوات المفتوحة المصدر "المجانية" على تكاليف حقيقية لا تظهر في سعر الترخيص. بالنسبة لـ Presidio، تهيمن هذه التكاليف على الوقت الهندسي - الإعداد الأولي (40-80 ساعة) والصيانة المستمرة (60-120 ساعة/سنة). عند معدلات الهندسة النموذجية، يجعل هذا Presidio أغلى من 20 إلى 75 مرة من بديل SaaS المدارة على أساس التكلفة الإجمالية للملكية.

السؤال المناسب ليس "ما تكلفة البرنامج؟" ولكن "ما تكلفة تشغيل البرنامج في الإنتاج؟" بالنسبة لمعظم المنظمات، فإن الإجابة تفضل بشكل حاسم SaaS المدارة.

المصادر:

هل أنت مستعد لحماية بياناتك؟

ابدأ بإخفاء المعلومات الشخصية مع أكثر من 285 نوع كيان عبر 48 لغة.