ব্লগে ফিরে যানপ্রযুক্তিগত

"বিনামূল্যে" ওপেন-সোর্স PII সনাক্তকরণের প্রকৃত খরচ...

স্ব-আতিথেয়তা Presidio প্রাথমিক সেটআপ 40-80 ঘন্টা এবং চলমান রক্ষণাবেক্ষণ 5-10 ঘন্টা/মাস প্রয়োজন। €100/ঘন্টা প্রকৌশল হার...

April 21, 20267 মিনিট পড়া
Presidio TCOopen-source costmanaged SaaSPII infrastructureDevOps cost

"বিনামূল্যে" ওপেন-সোর্স PII সনাক্তকরণের প্রকৃত খরচ: কেন Presidio খরচ €13,000/বছরের বেশি

"এটি বিনামূল্যে" মোট মালিকানা খরচ বিশ্লেষণ নয়। এটি লাইসেন্সিং খরচ — অনেক উপাদানের একটি।

মাইক্রোসফট Presidio বিনামূল্যে ডাউনলোড, ওপেন-সোর্স এবং মাইক্রোসফট দ্বারা সমর্থিত। সফ্টওয়্যার খরচ: €0। উৎপাদন-প্রস্তুত স্থাপনা অবকাঠামো, প্রকৌশল এবং রক্ষণাবেক্ষণ খরচ: অগ্রবর্তী প্রকৌশল সম্পদ সহ দল €13,200+/বছর। তাদের ছাড়া দল জন্য আরও।

একটি উৎপাদন Presidio স্থাপনা প্রকৃতপক্ষে কী প্রয়োজন

প্রাথমিক সেটআপ (40-80 প্রকৌশল ঘন্টা):

ডকার পরিবেশ কনফিগারেশন এবং নেটওয়ার্কিং: 4-8 ঘন্টা। Presidio স্থাপত্য একাধিক পাত্রে সমন্বয় প্রয়োজন (বিশ্লেষক সেবা, anonymizer সেবা, ঐচ্ছিক ছবি redactor)। পাত্রে মধ্যে নেটওয়ার্ক কনফিগারেশন অ-তুচ্ছ এবং ঘন ঘন GitHub সমস্যা হিসাবে নথিভুক্ত ব্যর্থতা পয়েন্ট।

Python পরিবেশ ব্যবস্থাপনা: 2-4 ঘন্টা। spaCy, presidio-বিশ্লেষক, presidio-anonymizer এবং তাদের transitive নির্ভরতা জটিল সংস্করণ সামঞ্জস্য প্রয়োজনীয়তা। GitHub শত শত খোলা সমস্যা দেখায় নির্ভরতা দ্বন্দ্ব সম্পর্কে, বিশেষত spaCy মডেল সংস্করণ এবং Python 3.8/3.9/3.10 সামঞ্জস্য মধ্যে।

ভাষা মডেল ডাউনলোড এবং ব্যবস্থাপনা: 2-4 ঘন্টা। spaCy ভাষা মডেল 300MB থেকে 1.4GB প্রতিটি রেঞ্জ। 5 ভাষা সমর্থন স্থাপনা 1.5-7GB মডেল সংরক্ষণ প্রয়োজন, উপযুক্ত লোডিং কনফিগারেশন এবং স্মৃতি বরাদ্দ। মডেল লোডিং ব্যর্থতা Presidio সমর্থন সমস্যা সবচেয়ে সাধারণ।

কাস্টম recognizer উন্নয়ন: 8-16 ঘন্টা। ডিফল্ট Presidio recognizer সেট ~40 সত্তা প্রকার কভার ফোকাসড US শনাক্তকারী। EU স্থাপনা ইউরোপীয় জাতীয় শনাক্তকারী প্রয়োজন। স্বাস্থ্যসেবা স্থাপনা চিকিৎসা রেকর্ড সংখ্যা ফর্ম্যাট প্রয়োজন। প্রতিটি কাস্টম recognizer Python PatternRecognizer বাস্তবায়ন, YAML রেজিস্ট্রেশন এবং পরীক্ষা প্রয়োজন।

API কনফিগারেশন এবং পরীক্ষা: 4-8 ঘন্টা। উৎপাদন API কনফিগারেশন timeout সেটিংস অন্তর্ভুক্ত, প্রমাণীকরণ, হার সীমাবদ্ধতা এবং লগিং। এই কনফিগারেশন ডকুমেন্টেশন বিরল; বেশিরভাগ দল GitHub সমস্যা আলোচনা থেকে তাদের অর্জন।

সম্মতি অডিট লগিং: 4-8 ঘন্টা। GDPR পরিচালনা প্রক্রিয়া রেকর্ড প্রদর্শনযোগ্য প্রয়োজন। Presidio ডিফল্ট দ্বারা অডিট লগিং অন্তর্ভুক্ত করে না — এটি একটি কাস্টম middleware স্তর হিসাবে যোগ অবশ্যই।

দল ডকুমেন্টেশন এবং onboarding: 4-8 ঘন্টা।

মোট প্রাথমিক সেটআপ: €100/ঘন্টা = €2,800-5,200 28-52 ঘন্টা

বার্ষিক রক্ষণাবেক্ষণ (60-120 ঘন্টা/বছর):

Presidio রিলিজ আপডেট বছরে 2-4 বার। প্রধান সংস্করণ আপডেট (Presidio 2.x) breaking API পরিবর্তন অন্তর্ভুক্ত করেছে উল্লেখযোগ্য পুনরায়-পরীক্ষা প্রয়োজন। একটি উৎপাদন স্থাপনা রক্ষা প্রকাশ ট্র্যাক, পরিবর্তন মূল্যায়ন, মঞ্চায় পরীক্ষা এবং স্থাপনা প্রয়োজন।

spaCy মডেল আপডেট: ভাষা মডেল উন্নতি সময়সময় প্রকাশ করা হয়। আপডেট মডেল পুনরায় ডাউনলোড, সনাক্তকরণ নির্ভুলতা পরিবর্তন পরীক্ষা এবং পুনরায়বাস্তবায়ন প্রয়োজন।

নির্ভরতা দ্বন্দ্ব সমাধান: Python ইকোসিস্টেম নির্ভরতা দ্বন্দ্ব একটি চলমান রক্ষণাবেক্ষণ বোঝা। প্রয়োজনীয়তা যা আজ কাজ করে পরবর্তী মাসে মুক্তিপ্রাপ্ত নিরাপত্তা প্যাচ দ্বন্দ্ব হতে পারে।

পরিচালনামূলক নিরীক্ষণ: পাত্রে স্বাস্থ্য নিরীক্ষণ, API প্রাপ্যতা চেক, স্মৃতি ফাঁস সনাক্তকরণ (spaCy মডেল স্মৃতি-নিবিড়) এবং পুনরায়আরম্ভ পদ্ধতি।

মোট বার্ষিক রক্ষণাবেক্ষণ: €100/ঘন্টা = €6,000-12,000 60-120 ঘন্টা

বীমা কোম্পানি কেস স্টাডি

একটি বীমা কোম্পানিতে সম্মতি দল প্রাক্লেম নথি প্রক্রিয়াকরণের জন্য Presidio স্থাপনা উদ্যোগ। দল দুই জুনিয়র ডেটা প্রকৌশলী এবং কোনো ডেডিকেটেড DevOps নেই।

সপ্তাহ 1: বহু-পাত্রে স্থাপত্য সহ Docker নেটওয়ার্ক সমস্যা। Presidio বিশ্লেষক এবং anonymizer সেবা যোগাযোগ করতে অক্ষম। GitHub সমস্যা সাহায্য সহ 3 দিন পরে সমাধান।

সপ্তাহ 2: উৎপাদন পরিবেশে spaCy মডেল লোডিং ব্যর্থতা (উন্নয়ন থেকে আলাদা স্মৃতি কনফিগারেশন)। সনাক্তকরণ 2 দিন, সমাধান 1 দিন।

সপ্তাহ 3: UK জাতীয় বীমা সংখ্যা (NINO) ফর্ম্যাট জন্য কাস্টম recognizer। প্যাটার্ন পরীক্ষায় কাজ করেছে কিন্তু উৎপাদন নথিতে মিথ্যা ইতিবাচক উৎপাদিত। টিউনিং 2 অতিরিক্ত দিন।

সপ্তাহ 4: প্রকল্প escalated। 4-সপ্তাহ অনুমান স্থাপনা 3 প্রকৌশল সপ্তাহ খরচ করেছে এবং উৎপাদন-প্রস্তুত ছিল না।

বিকল্প মূল্যায়ন: anonym.legal অ্যাকাউন্ট তৈরি। প্রথম নথি বেনামিকৃত: signup পরে 12 মিনিট। UK NINO সনাক্তকরণ: ডিফল্ট সত্তা লাইব্রেরি অন্তর্ভুক্ত। কনফিগারেশন প্রয়োজন।

সিদ্ধান্ত: anonym.legal পেশাদার পরিকল্পনা €180/বছর গৃহীত।

এই সংস্থা জন্য TCO তুলনা:

  • অনুমান Presidio উৎপাদন স্থাপনা: অতিরিক্ত 2-4 সপ্তাহ = 40-80 প্রকৌশল ঘন্টা = €4,000-8,000

  • বার্ষিক Presidio রক্ষণাবেক্ষণ (ডেডিকেটেড DevOps ছাড়া): আউটসোর্সড = €6,000-12,000/বছর

  • বছর-1 মোট: €10,000-20,000

  • anonym.legal পেশাদার: €180/বছর

  • স্থাপনা জন্য প্রকৌশল সময়: 12 মিনিট (negligible)

  • বছর-1 মোট: €180

আত্ম-আতিথেয় Presidio পরিচালনা বনাম সংরক্ষিত প্রকৌশল সময়: 60 ঘন্টা প্রাথমিক সেটআপ + 72 ঘন্টা/বছর রক্ষণাবেক্ষণ = বার্ষিক প্রায় 132 ঘন্টা €100/ঘন্টা = €13,200 বনাম €180 খরচ সংরক্ষিত।

যখন স্ব-আতিথেয় Presidio অর্থ দেয়

TCO বিশ্লেষণ বেশিরভাগ সংস্থা জন্য পরিচালিত SaaS পছন্দ করে। স্ব-আতিথেয়তা যখন উপযুক্ত:

ডেটা সার্বভৌমত্ব প্রয়োজনীয়তা: নিয়ন্ত্রক বা চুক্তিগত প্রয়োজনীয়তা বাহ্যিক সার্ভার ডেটা সংক্রমণ নিষিদ্ধ। নোট: anonym.legal এর ডেস্কটপ অ্যাপ (anonym.plus) অফলাইন প্রক্রিয়াকরণ প্রদান করে, Presidio-স্তরের নির্ভুলতা বজায় রেখে স্ব-আতিথেয় Presidio চেয়ে নিম্ন TCO মধ্যে স্থানীয় পরিবেশ ছেড়ে ডেটা রাখা নিশ্চিত করে এই প্রয়োজন সমাধান।

চরম প্রক্রিয়া ভলিউম: লক্ষ লক্ষ API কল প্রতি দিন যেখানে প্রতি-অনুরোধ মূল্য অবকাঠামো খরচ অতিক্রম করে। এই স্কেলে, অবকাঠামো বিনিয়োগ ভলিউম অর্থনীতি দ্বারা justified হয়।

গভীর কাস্টমাইজেশন: সংস্থাগুলি একটি পণ্যে PII সনাক্তকরণ নির্মাণ প্রয়োজনীয়তা সঙ্গে পূরণ করে না যে পরিচালিত সেবা এর সত্তা লাইব্রেরি বা API ডিজাইন। কাস্টম recognizer উন্নয়ন Presidio উপর উপযুক্ত।

বিদ্যমান DevOps অবকাঠামো: সংস্থাগুলি অনেক পরিচালিত সেবা হিসাবে Presidio চিকিত্সা ডেডিকেটেড প্ল্যাটফর্ম প্রকৌশল সঙ্গে। প্রান্তিক খরচ অবকাঠামো ব্যবস্থাপনা ইতিমধ্যে একটি সিঙ্ক খরচ যখন নিম্ন।

অন্য 95% সংস্থা জন্য — ডেডিকেটেড DevOps ছাড়া দল, তাদের অ-প্রযুক্তিগত কর্মীদের ব্যবহার করতে পারে সম্মতি বিভাগ, স্টার্টআপ তারা অবকাঠামো প্রকৌশলী আছে আগে সম্মতি প্রয়োজন — পরিচালিত সেবা TCO অপ্রতিরোধ্যভাবে অনুকূল।

সমাপ্তি

"বিনামূল্যে" ওপেন-সোর্স সরঞ্জাম লাইসেন্স মূল্যে প্রদর্শিত হয় না প্রকৃত খরচ। Presidio জন্য, সেই খরচ প্রাধান্য প্রকৌশল সময় — প্রাথমিক সেটআপ (40-80 ঘন্টা) এবং চলমান রক্ষণাবেক্ষণ (60-120 ঘন্টা/বছর) দ্বারা আধিপত্য বিস্তার করা হয়। সাধারণ প্রকৌশল হার এ, এটি পরিচালিত SaaS বিকল্প সঙ্গে 20-75x আরও ব্যয়বহুল করে তোলে একটি মোট মালিকানা খরচ ভিত্তিতে।

যথাযথ প্রশ্ন হল "সফটওয়্যার খরচ কত?" কিন্তু "উৎপাদন সফটওয়্যার চালাতে খরচ কত?" বেশিরভাগ সংস্থার জন্য, উত্তর দৃঢ়ভাবে পরিচালিত SaaS পছন্দ করে।

উৎসমূহ:

আপনার তথ্য সুরক্ষিত করতে প্রস্তুত?

48 ভাষায় 285+ সত্তা প্রকারের সাথে PII অ্যানোনিমাইজ করা শুরু করুন।