"Ücretsiz" KVVi Tespitinin Gerçek Maliyeti
"Ücretsiz" bir maliyet analizi değil. Bu bir lisans fiyatı — pek çok faktörden biri.
Microsoft Presidio'yu indirmek 0 €'ya mal oluyor. Yazılım açık kaynaklı. Ama bir sigorta şirketinde çalıştırmak ilk yılda 13.000 €'nun üzerinde bir maliyete yol açıyor. Bu fark mühendislik zamanıdır.
Üretim Dağıtımı Neye İhtiyaç Duyar
Aracı üretime hazırlamak 40–80 saat sürüyor. Bu zamanın nereye gittiği:
Docker kurulumu: 4–8 saat. Araç birden fazla konteyner kullanıyor. Bir analizör servisi, bir anonimleştirici servis ve isteğe bağlı bir görüntü düzenleyici. Bunları birbirleriyle iletişim kurmaya zorlamak zor. GitHub sorunları bunun yaygın bir başarısızlık noktası olduğunu gösteriyor.
Python kurulumu: 2–4 saat. Kütüphanelerin katı sürüm kuralları var. Çakışmalar yaygın — özellikle spaCy model sürümleri ile Python 3.8/3.9/3.10 arasında. GitHub bu konuda yüzlerce açık sorun gösteriyor.
Dil modeli indirmeleri: 2–4 saat. spaCy modelleri 300 MB ile 1,4 GB arasında değişiyor. Beş dilli bir kurulum 1,5–7 GB depolama alanı gerektiriyor. Model yükleme hataları en yaygın destek sorunları arasında.
Özel tanımlayıcılar: 8–16 saat. Varsayılan set yaklaşık 40 varlık türünü kapsıyor. Çoğu ABD tanımlayıcısı. AB dağıtımları Avrupa ulusal kimliklerine ihtiyaç duyuyor. Sağlık ekipleri tıbbi kayıt formatlarına ihtiyaç duyuyor. Her tür Python kodu, YAML kurulumu ve test gerektiriyor.
API kurulumu: 4–8 saat. Üretim yapılandırması zaman aşımları, kimlik doğrulama, hız sınırları ve günlük kaydı içeriyor. Resmi belgeler ince. Çoğu ekip yanıtları GitHub sorun başlıklarında buluyor.
Denetim günlüğü: 4–8 saat. GDPR veri işlemenin kayıtlarını gerektiriyor. Araçta varsayılan olarak denetim günlüğü yok. Ekipler bunu özel kod olarak yazmak zorunda.
Ekip belgeleri: 4–8 saat.
Toplam ilk kurulum: 100 €/saatte 28–52 saat = 2.800–5.200 €.
Yıllık Bakım Maliyetleri
Araç yılda 2–4 kez güncelleme gönderiyor. Büyük sürümler API'leri bozdu. Güncel kalmak değişiklikleri takip etmeyi, hazırlık ortamında test etmeyi ve dağıtmayı gerektiriyor.
spaCy model güncellemeleri de iş ekliyor. Yeni model sürümleri yayına girmeden önce yeniden indirilmeli ve doğruluk kontrolleri yapılmalı.
Python bağımlılık çakışmaları devam ediyor. Bugün temiz bir kurulum, gelecek ay bir güvenlik yaması geldiğinde bozulabilir.
İzleme de süregelen bir iş. Konteyner sağlığı, bellek sızıntıları ve yeniden başlatma adımlarının hepsi düzenli ilgi gerektiriyor. spaCy modelleri bellek açısından ağır.
Toplam yıllık bakım: 100 €/saatte 60–120 saat = 6.000–12.000 €.
Gerçek Dünyadan Bir Vaka Çalışması
Bir sigorta firmasındaki uyumluluk ekibi talep belgelerini işlemeye hazırlandı. İki genç veri mühendisleri vardı ve DevOps desteği yoktu.
1. hafta. İki ana konteyner birbirleriyle iletişim kuramadı. GitHub yardımıyla üç günde çözüldü.
2. hafta. Modeller üretimde yüklenmedi. Bellek yapılandırması geliştirme ortamından farklıydı. İki günde teşhis, bir gün daha düzeltme.
3. hafta. Özel bir İngiltere Ulusal Sigorta Numarası kuralı testlerde çalıştı ama gerçek belgelerde yanlış pozitifler üretti. İki gün daha ayarlama.
4. hafta. Proje eskalasyona uğradı. Üç mühendislik haftası harcandı. Hâlâ üretimde değil.
Ekip ardından anonym.legal'ı denedi. Kayıt sonrası 12 dakika içinde ilk belge işlendi. İngiltere Ulusal Sigorta Numarası tespiti zaten yerleşikti. Kurulum gerekmedi.
anonym.legal Professional'a yıllık 180 €'ya geçtiler.
Birinci yıl Toplam Sahip Olma Maliyeti:
- Kendi barındırma yolu — bitirmek için 40–80 saat daha, ardından yılda 6.000–12.000 € bakım. Toplam: 10.000–20.000 €.
- anonym.legal Professional — yılda 180 €. Dağıtım süresi: ~12 dakika.
- Tasarruf edilen mühendislik saatleri: 100 €/saatte yılda ~132 saat = 13.200 €.
Birinci yılda 70 katlık bir maliyet farkı bu.
Yanlış pozitif sorunlarıyla da karşılaşan ekipler için Presidio'nun hassasiyet sorununa dair yazımıza bakın.
Kendi Barındırmanın Daha Mantıklı Olduğu Durumlar
Yönetilen SaaS çoğu ekip için kazanıyor. Ama kendi barındırma bazı durumlara uygun.
Veri egemenliği. Bazı kurallar veya sözleşmeler verilerin dışarı gönderilmesini yasaklıyor. Masaüstü Uygulamamız (anonym.plus) tamamen çevrimdışı çalışıyor. Makineden hiçbir veri çıkmıyor. Aynı doğruluk, sunucu gerekmiyor.
Çok yüksek hacim. Günde milyonlarca API çağrısı, çağrı başına fiyatlamayı sunucu maliyetlerinin üzerine çıkarabilir. Bu ölçekte kendi yığınınıza sahip olmak mantıklı.
Ürün entegrasyonu. KVVi tespitini kendi ürününüze entegre ediyor ve tam kontrole ihtiyaç mı duyuyorsunuz? Özel açık kaynak çalışması burada geçerli.
Mevcut DevOps. Birçok hizmeti zaten çalıştıran bir platform ekibine sahip ekipler daha düşük ek maliyetle karşılaşıyor. Altyapı onlar için batık bir maliyet.
Bunların dışındaki herkes için — uyumluluk ekipleri, girişimler, DevOps'suz ekipler — yönetilen SaaS açık tercih. Barındırılan işlemenin kurumsal gereksinimleri nasıl karşıladığı için güvenlik uyumluluk genel bakışımıza bakın.
Sonuç
Açık kaynaklı araçların lisansta görünmeyen maliyetleri var. Bu tür araç için büyük maliyet mühendislik zamanıdır. Kurulum: 40–80 saat. Yıllık bakım: 60–120 saat. Normal ücretlerle kendi barındırma yolu, yönetilen hizmetten 20–75 kat daha pahalıya mal oluyor.
Doğru soru "yazılım ne kadar?" değil. Doğru soru "onu çalıştırmak ne kadar?" Çoğu ekip için bu yanıt yönetilen SaaS'ı işaret ediyor.
Kaynaklar
Microsoft Presidio GitHub: Sorunlar ve Kurulum Belgeleri. DOĞRULANDI-DIŞ.
Ploomber: Presidio Üretim Dağıtım Kılavuzu. DOĞRULANDI-DIŞ.
GDPR Madde 32: Uygun güvenlik için teknik önlemler. DOĞRULANDI-DIŞ.