By · Last updated 2026-06-05

Bloga DönTeknik

6 Haftadan 3 Güne: Yönetilen KVVi Kurulumu

Sağlık SaaS ekipleri, yönetilen API'ye geçmeden önce kendi barındırmalı Presidio üretim dağıtımında 6 hafta harcıyor. Yönetilen API bu dağıtımı tamamen ortadan kaldırıyor.

June 5, 20267 dk okuma
managed PII APIPresidio productionPHI anonymizationhealthcare SaaSbuild vs buy

Altı Haftalık DevOps Acısından 3 Günlük Entegrasyona

2026 için güncellendi.

Altı hafta. İki mühendis. Dört başarısız dağıtım girişimi. Bir sağlık SaaS ekibi bunların hepsini kendi barındırmalı bir Presidio kurulumuna harcadı. Ardından yönetilen bir API'ye geçtiler. Geçiş 3 günde tamamlandı.

Açık kaynaklı yazılımdaki "ücretsiz" etiketi cazip. Tam kontrole dair vaat de öyle. Ama gerçek maliyet mühendislik saatlerinde ortaya çıkıyor. Lisans ücretlerinde değil.

Presidio Belgelerinin Kapsamadıkları

Presidio'nun belgeleri yerel kurulumu iyi ele alıyor. İki Docker konteyneri çalıştırın. Anonimleştiriciyi analizöre yönlendirin. Dizüstü bilgisayarınızda çalışıyor.

Üretim farklı bir hikaye.

Ölçekleme: Yerel Presidio tek örnek olarak çalışıyor. Üretim, bir yük dengeleyicinin arkasında birden fazla örnek, sağlık denetlemeleri ve zarif başarısızlık gerektiriyor. Presidio belgelerinde bu konuda hiçbir rehberlik yok. Her ekip bunu kendi başına çözüyor.

Bellek kullanımı: spaCy modelleri örnek başına RAM'e yükleniyor. Yalnızca en_core_web_lg modeli 741 MB. Bellek baskısı altında performans düşüyor. Ardından işlem bellek yetersizliği hatasıyla çöküyor. Presidio'nun bunun için yerleşik bir rehberliği yok.

Zaman aşımları: Büyük belgeler daha uzun sürüyor. Üretim kodu yapılandırılabilir zaman aşımları, güvenli zaman aşımı yanıtları ve yeniden deneme mantığı gerektiriyor. Bunların hiçbiri Presidio'da belgelenmiyor.

Model yükleme hataları: Yüksek eş zamanlılık altında, birden fazla çalışan aynı anda aynı spaCy modelini yüklemeye çalışıyor. Bu bir yarış koşulu. Sonuç, yeniden üretilmesi zor rastgele 500 hataları. Presidio GitHub sorunları bunu belgeliyor. Ana belgeler belgelemiyor.

Denetim günlükleri: GDPR ve HIPAA, KVVi işleme için denetim izleri gerektiriyor. Presidio'nun yerleşik günlüğü yok. Her ekip kendi ara yazılımını yazmak zorunda.

API sürümleme: Presidio'nun API'si sürümler arasında değişti. Presidio 2.0 için yazılmış kod 2.2 ve üzeri için güncelleme gerektirebilir. Sürüm sabitleme yardımcı oluyor. Ama kendi bakım yükünü de getiriyor.

Bir Sağlık SaaS Ekibinin Altı Haftası

Bu ekip, araştırma veri dışa aktarma hattına KGBi anonimleştirme entegre etti.

1. hafta: Presidio belgelerini takip ettiler. Yerel geliştirme çalıştı. Kubernetes dağıtımı başarısız oldu. Pod başlatma model yükleme hataları attı. Ekip Kubernetes yapılandırma sorunlarını kovaladı.

2. hafta: Kubernetes yapılandırması düzeltildi. Model yükleme bazen çalıştı. Yük testi altında isteklerin yaklaşık %15'i model yükleme zaman aşımlarıyla başarısız oldu. Yeniden deneme mantığı eklendi.

3. hafta: Yeniden deneme mantığı temel sorunu gizledi ama yük testlerini geçti. Uyumluluk incelemesi denetim günlükleri istedi. Ekip özel günlük ara yazılımı yazdı.

4. hafta: Sağlık varlık türleri — tıbbi kayıt numaraları, sağlık planı kimlikleri — Presidio varsayılanlarında kapsanmıyordu. Ekip iki özel tanımlayıcı yazdı.

5. hafta: Üretime geçildi. Bellek sızıntısı ortaya çıktı. spaCy model nesneleri istekler arasında birikti. Ekip geçici çözüm olarak günlük pod yeniden başlatması ekledi.

6. hafta: Üretim gerçek trafikte başarısız oldu. Günlük yeniden başlatma servis kesintilerine neden oldu. Temel neden açıktı: bellek sızıntısı ya büyük bir uygulama yeniden tasarımı ya da farklı bir araç gerektiriyordu.

İnceleme: Mühendislik yöneticisi rakamları hesapladı. İki mühendisle altı hafta eşittir 12 mühendislik haftası. Dağıtım canlıydı ama kararsız. Süregelen bakım haftada 5 ile 10 saat olarak tahmin edildi.

Geçiş: Ekip anonym.legal API'sini test etti. KGBi varlık kapsamı kutudan çıktığı haliyle çalıştı. Özel tanımlayıcı gerekmedi. SLA destekli çalışma süresi. Denetim günlüğü dahil. Entegrasyon mevcut API istemci kodları kullanılarak 3 günde tamamlandı.

Maliyet karşılaştırması:

  • ABD piyasası ücretleriyle 12 mühendislik haftası: 48.000 ile 72.000 $
  • Kendi barındırma için tahmini yıllık bakım: 25.000 ile 40.000 $
  • anonym.legal Business planı: yılda 348 € (yaklaşık 385 $)

Yönetilen API, ilk saatte kendi barındırma yapımının maliyetinden daha az maliyetle ilk haftasını geçiriyor.

Veriler Ağınızdan Çıkamadığında

Bazı sağlık ekipleri herhangi bir harici servise veri gönderemiyor. Hava boşluğu kuralları veya veri egemenliği politikaları bunu engelliyor.

Bu durumlar için Masaüstü Uygulaması (anonym.plus) aynı motoru yerel kurulumda sunuyor:

  • Aynı tespit motoru: Presidio artı XLM-RoBERTa
  • Harici servislere çağrı yok
  • Klinik notlar ve araştırma veri kümeleri için toplu işleme
  • Kurulumun ötesinde hazırlık gerektirmiyor
  • Otomatik model yönetimi

Bu, yönetilen SaaS'a yapılan ana itirazı ortadan kaldırıyor: "verilerimiz çıkamaz." Yönetilen araçları değerli kılan basitliği korurken.

Yapma - Satın Alma: Basit Bir Çerçeve

Yönetilen API seçin:

  • Ekibinizde özel altyapı mühendisleri yoksa
  • Günler içinde, haftalar değil, teslim etmeniz gerekiyorsa
  • SLA destekli çalışma süresi bir gereksinimse
  • Yönetilen hizmet varlık türlerinizi kapsıyorsa
  • Denetim günlükleri ve uyumluluk kayıtlarının dahil olmasına ihtiyacınız varsa

Kendi barındırmayı seçin:

  • Mevzuat verilerin ağınızdan çıkmasını engelliyorsa (önce Masaüstü Uygulamasını kontrol edin)
  • İşlem hacminiz kendi barındırmayı ölçekte daha ucuz kılıyorsa
  • API'nin destekleyemeyeceği derin özelleştirmeye ihtiyacınız varsa
  • Bunu birçok yönetilen hizmetin yanı sıra ele alan bir platform ekibiniz varsa

Masaüstü Uygulamasını seçin:

  • Çevrimdışı işleme gerektiğinde
  • Tıbbi araştırma verileri klinik ortamdan çıkamadığında
  • Finansal veriler coğrafi işleme sınırlarına sahip olduğunda

Sonuç

Altı haftalık mühendislik zamanı bir Presidio kusuru değil. Kendi başınıza herhangi bir üretim kalitesinde NLP hizmetini çalıştırmanın beklenen maliyeti bu. Ölçekleme, bellek sorunları, model yükleme hataları, denetim günlükleri ve özel varlık çalışması hızla birikir.

Yönetilen API'ler bu maliyeti üstlenir. KVVi anonimleştirme için — bir ürün özelliği değil, bir uyumluluk ihtiyacı — yönetilen yol neredeyse her zaman toplam sahip olma maliyetinde kazanır.

anonym.legal API'sinin KGBi tespitini nasıl ele aldığını okuyun. Tam uyumluluk ayrıntılarını güvenlik genel bakışımızda görün. Planları fiyatlandırma sayfamızda karşılaştırın.

Kaynaklar

  • Ploomber: Presidio Üretim Dağıtımına Derinlemesine Bakış — ploomber.io.
  • Microsoft Fabric Community: PySpark ile Presidio — blog.fabric.microsoft.com.
  • Presidio GitHub: Üretim Dağıtım Sorunları — github.com/microsoft/presidio/issues.

Verilerinizi korumaya hazır mısınız?

48 dilde 285+ varlık türü ile PII anonimleştirmeye başlayın.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.