Altı Haftalık DevOps Acısından 3 Günlük Entegrasyona
2026 için güncellendi.
Altı hafta. İki mühendis. Dört başarısız dağıtım girişimi. Bir sağlık SaaS ekibi bunların hepsini kendi barındırmalı bir Presidio kurulumuna harcadı. Ardından yönetilen bir API'ye geçtiler. Geçiş 3 günde tamamlandı.
Açık kaynaklı yazılımdaki "ücretsiz" etiketi cazip. Tam kontrole dair vaat de öyle. Ama gerçek maliyet mühendislik saatlerinde ortaya çıkıyor. Lisans ücretlerinde değil.
Presidio Belgelerinin Kapsamadıkları
Presidio'nun belgeleri yerel kurulumu iyi ele alıyor. İki Docker konteyneri çalıştırın. Anonimleştiriciyi analizöre yönlendirin. Dizüstü bilgisayarınızda çalışıyor.
Üretim farklı bir hikaye.
Ölçekleme: Yerel Presidio tek örnek olarak çalışıyor. Üretim, bir yük dengeleyicinin arkasında birden fazla örnek, sağlık denetlemeleri ve zarif başarısızlık gerektiriyor. Presidio belgelerinde bu konuda hiçbir rehberlik yok. Her ekip bunu kendi başına çözüyor.
Bellek kullanımı: spaCy modelleri örnek başına RAM'e yükleniyor. Yalnızca en_core_web_lg modeli 741 MB. Bellek baskısı altında performans düşüyor. Ardından işlem bellek yetersizliği hatasıyla çöküyor. Presidio'nun bunun için yerleşik bir rehberliği yok.
Zaman aşımları: Büyük belgeler daha uzun sürüyor. Üretim kodu yapılandırılabilir zaman aşımları, güvenli zaman aşımı yanıtları ve yeniden deneme mantığı gerektiriyor. Bunların hiçbiri Presidio'da belgelenmiyor.
Model yükleme hataları: Yüksek eş zamanlılık altında, birden fazla çalışan aynı anda aynı spaCy modelini yüklemeye çalışıyor. Bu bir yarış koşulu. Sonuç, yeniden üretilmesi zor rastgele 500 hataları. Presidio GitHub sorunları bunu belgeliyor. Ana belgeler belgelemiyor.
Denetim günlükleri: GDPR ve HIPAA, KVVi işleme için denetim izleri gerektiriyor. Presidio'nun yerleşik günlüğü yok. Her ekip kendi ara yazılımını yazmak zorunda.
API sürümleme: Presidio'nun API'si sürümler arasında değişti. Presidio 2.0 için yazılmış kod 2.2 ve üzeri için güncelleme gerektirebilir. Sürüm sabitleme yardımcı oluyor. Ama kendi bakım yükünü de getiriyor.
Bir Sağlık SaaS Ekibinin Altı Haftası
Bu ekip, araştırma veri dışa aktarma hattına KGBi anonimleştirme entegre etti.
1. hafta: Presidio belgelerini takip ettiler. Yerel geliştirme çalıştı. Kubernetes dağıtımı başarısız oldu. Pod başlatma model yükleme hataları attı. Ekip Kubernetes yapılandırma sorunlarını kovaladı.
2. hafta: Kubernetes yapılandırması düzeltildi. Model yükleme bazen çalıştı. Yük testi altında isteklerin yaklaşık %15'i model yükleme zaman aşımlarıyla başarısız oldu. Yeniden deneme mantığı eklendi.
3. hafta: Yeniden deneme mantığı temel sorunu gizledi ama yük testlerini geçti. Uyumluluk incelemesi denetim günlükleri istedi. Ekip özel günlük ara yazılımı yazdı.
4. hafta: Sağlık varlık türleri — tıbbi kayıt numaraları, sağlık planı kimlikleri — Presidio varsayılanlarında kapsanmıyordu. Ekip iki özel tanımlayıcı yazdı.
5. hafta: Üretime geçildi. Bellek sızıntısı ortaya çıktı. spaCy model nesneleri istekler arasında birikti. Ekip geçici çözüm olarak günlük pod yeniden başlatması ekledi.
6. hafta: Üretim gerçek trafikte başarısız oldu. Günlük yeniden başlatma servis kesintilerine neden oldu. Temel neden açıktı: bellek sızıntısı ya büyük bir uygulama yeniden tasarımı ya da farklı bir araç gerektiriyordu.
İnceleme: Mühendislik yöneticisi rakamları hesapladı. İki mühendisle altı hafta eşittir 12 mühendislik haftası. Dağıtım canlıydı ama kararsız. Süregelen bakım haftada 5 ile 10 saat olarak tahmin edildi.
Geçiş: Ekip anonym.legal API'sini test etti. KGBi varlık kapsamı kutudan çıktığı haliyle çalıştı. Özel tanımlayıcı gerekmedi. SLA destekli çalışma süresi. Denetim günlüğü dahil. Entegrasyon mevcut API istemci kodları kullanılarak 3 günde tamamlandı.
Maliyet karşılaştırması:
- ABD piyasası ücretleriyle 12 mühendislik haftası: 48.000 ile 72.000 $
- Kendi barındırma için tahmini yıllık bakım: 25.000 ile 40.000 $
- anonym.legal Business planı: yılda 348 € (yaklaşık 385 $)
Yönetilen API, ilk saatte kendi barındırma yapımının maliyetinden daha az maliyetle ilk haftasını geçiriyor.
Veriler Ağınızdan Çıkamadığında
Bazı sağlık ekipleri herhangi bir harici servise veri gönderemiyor. Hava boşluğu kuralları veya veri egemenliği politikaları bunu engelliyor.
Bu durumlar için Masaüstü Uygulaması (anonym.plus) aynı motoru yerel kurulumda sunuyor:
- Aynı tespit motoru: Presidio artı XLM-RoBERTa
- Harici servislere çağrı yok
- Klinik notlar ve araştırma veri kümeleri için toplu işleme
- Kurulumun ötesinde hazırlık gerektirmiyor
- Otomatik model yönetimi
Bu, yönetilen SaaS'a yapılan ana itirazı ortadan kaldırıyor: "verilerimiz çıkamaz." Yönetilen araçları değerli kılan basitliği korurken.
Yapma - Satın Alma: Basit Bir Çerçeve
Yönetilen API seçin:
- Ekibinizde özel altyapı mühendisleri yoksa
- Günler içinde, haftalar değil, teslim etmeniz gerekiyorsa
- SLA destekli çalışma süresi bir gereksinimse
- Yönetilen hizmet varlık türlerinizi kapsıyorsa
- Denetim günlükleri ve uyumluluk kayıtlarının dahil olmasına ihtiyacınız varsa
Kendi barındırmayı seçin:
- Mevzuat verilerin ağınızdan çıkmasını engelliyorsa (önce Masaüstü Uygulamasını kontrol edin)
- İşlem hacminiz kendi barındırmayı ölçekte daha ucuz kılıyorsa
- API'nin destekleyemeyeceği derin özelleştirmeye ihtiyacınız varsa
- Bunu birçok yönetilen hizmetin yanı sıra ele alan bir platform ekibiniz varsa
Masaüstü Uygulamasını seçin:
- Çevrimdışı işleme gerektiğinde
- Tıbbi araştırma verileri klinik ortamdan çıkamadığında
- Finansal veriler coğrafi işleme sınırlarına sahip olduğunda
Sonuç
Altı haftalık mühendislik zamanı bir Presidio kusuru değil. Kendi başınıza herhangi bir üretim kalitesinde NLP hizmetini çalıştırmanın beklenen maliyeti bu. Ölçekleme, bellek sorunları, model yükleme hataları, denetim günlükleri ve özel varlık çalışması hızla birikir.
Yönetilen API'ler bu maliyeti üstlenir. KVVi anonimleştirme için — bir ürün özelliği değil, bir uyumluluk ihtiyacı — yönetilen yol neredeyse her zaman toplam sahip olma maliyetinde kazanır.
anonym.legal API'sinin KGBi tespitini nasıl ele aldığını okuyun. Tam uyumluluk ayrıntılarını güvenlik genel bakışımızda görün. Planları fiyatlandırma sayfamızda karşılaştırın.
Kaynaklar
- Ploomber: Presidio Üretim Dağıtımına Derinlemesine Bakış — ploomber.io.
- Microsoft Fabric Community: PySpark ile Presidio — blog.fabric.microsoft.com.
- Presidio GitHub: Üretim Dağıtım Sorunları — github.com/microsoft/presidio/issues.