Kembali ke BlogTeknikal

Kos Sebenar Pengesanan PII Sumber Terbuka "Gratis"...

Menyelaras sendiri Presidio memerlukan 40-80 jam penetapan awal dan 5-10 jam/bulan penyelenggaraan berkelanjutan.

April 21, 20267 min baca
Presidio TCOopen-source costmanaged SaaSPII infrastructureDevOps cost

Kos Sebenar Pengesanan PII Sumber Terbuka "Gratis": Mengapa Presidio Berharga Lebih Daripada €13,000 Setahun

"Ia gratis" bukanlah analisis kos pemilikan keseluruhan. Ia adalah kos pelesenan — satu komponen daripada banyak.

Microsoft Presidio adalah percuma untuk dimuat turun, sumber terbuka, dan disokong oleh Microsoft. Kos perisian: €0. Kos infrastruktur, kejuruteraan, dan penyelenggaraan untuk penggunaan yang siap untuk pengeluaran: €13,200+/tahun untuk pasukan dengan sumber kejuruteraan kanan. Lebih banyak untuk pasukan tanpa mereka.

Apa yang Benar-benar Diperlukan oleh Penyebaran Presidio Pengeluaran

Penetapan awal (40-80 jam kejuruteraan):

Konfigurasi persekitaran Docker dan rangkaian: 4-8 jam. Seni bina Presidio memerlukan menyelaras berbilang bekas (perkhidmatan penganalisis, perkhidmatan penganoniman, pengubahsuaian imej pilihan). Konfigurasi rangkaian antara bekas adalah tidak-remeh dan kerap didokumentasikan sebagai titik kegagalan dalam isu GitHub.

Pengurusan persekitaran Python: 2-4 jam. spaCy, presidio-analyzer, presidio-anonymizer, dan kebergantungan transitif mereka mempunyai keperluan keserasian versi yang kompleks. GitHub menunjukkan ratusan isu terbuka yang berkaitan dengan konflik kebergantungan, terutama antara versi model spaCy dan keserasian Python 3.8/3.9/3.10.

Muat turun dan pengurusan model bahasa: 2-4 jam. Model bahasa spaCy berjulat dari 300MB hingga 1.4GB setiap satu. Sebuah penyebaran yang menyokong 5 bahasa memerlukan 1.5-7GB penyimpanan model, konfigurasi pemuatan yang sesuai, dan peruntukan memori. Kegagalan pemuatan model adalah salah satu isu sokongan Presidio yang paling biasa.

Pengiktirafan entiti tersuai: 3-6 jam. Presidio menyediakan kerangka kerja untuk menambah pengiktiraf yang tersuai untuk entiti berkuasa tinggi yang unik untuk industri atau organisasi. Melaksanakan, menguji, dan merapatkan pengiktiraf yang tersuai memerlukan kefahaman mendalam tentang ekspresi biasa, NER, dan tindak balas positif palsu organisasi-khusus.

Integrasi saluran pipa CI/CD: 3-5 jam. Penyebaran pengeluaran memerlukan penggabungan Presidio ke dalam saluran pipa pembentukan, pengujian, dan pelaksanaan sedia ada. Bekas, orkestrasyon (Kubernetes atau Docker Compose), dan baki penjejakan—semua memerlukan kerja kejuruteraan.

Penyelenggaraan berkelanjutan (5-10 jam/bulan):

Pemantauan prestasi dan log: 1-2 jam/bulan. Presidio mempunyai api perkhidmatan yang berbeza untuk penganalisis dan penganoniman. Setiap perkhidmatan memerlukan pemantauan prestasi, kegagalan yang dicatat, dan pengendalian ralat. Pelanggaran memori adalah perkara biasa.

Kemas kini kebergantungan dan model: 2-4 jam/bulan. spaCy mengeluarkan kemas kini model bahasa setiap bulan. Presidio mempunyai kemas kini keselamatan. Pasukan DevOps mestilah menguji setiap kemas kini dalam persekitaran pentarafan sebelum melancarkan ke pengeluaran untuk mengelakkan pergeseran pengesanan dan kerosakan entiti.

Penyelarasan masalah pengguna dan penyokong: 1-3 jam/bulan. Persekitaran pengeluaran yang baru dibina selalunya menghadapi masalah yang tidak dijangka: kegagalan permintaan API yang tergantung, peningkatan laten masa tindak balas, entiti yang hilang dalam dokumen tertentu.

Anggaran biaya: €13,200+ setiap tahun untuk pasukan dengan jurutera berpengalaman yang ada; €25,000-40,000+ setiap tahun untuk organisasi yang mengupah untuk keupayaan Presidio khusus.

Untuk perbandingan: SaaS terurus anonym.legal berharga €180/tahun dan mengambil 3 hari untuk penyepaduan (tanpa kos infrastruktur atau penjenjangan berulang).

Sedia untuk melindungi data anda?

Mulakan pengenalan PII dengan 285+ jenis entiti dalam 48 bahasa.