DevOps Minaren Sei Astetik 3 Eguneko Integraziora
2026rako eguneratua.
Sei aste. Bi ingeniari. Lau hedapen-saiakera huts. Osasun SaaS talde batek hori guztia autobertako Presidio konfigurazio batean eman zuen. Ondoren kudeatu APIra aldatu ziren. Aldaketa hiru egun behar izan zuen.
Kode irekiko softwarearen "dohainik" etiketa erakargarria da. Bai kontrol osoarekiko agindua ere. Baina benetako kostua ingeniaritza-orduetan agertzen da. Ez lizentzia-tasen.
Presidio Dokumentuek Ez Dutena Estaltzen
Presidioren dokumentuek tokiko konfigurazioa ondo estaltzen dute. Bi Docker edukiontzi exekutatu. Anonimizatzailea analizatzaileari begira jarri. Zure ordenagailu eramangarrian funtzionatzen du.
Produkzioa beste istorio bat da.
Eskalatzea: Tokiko Presidio instantzia bakar gisa exekutatzen da. Produkzioak hainbat instantzia behar ditu karga-oreka, osasun-egiaztapenak eta porrot dotorea. Presidio dokumentuek ez dute horren inguruko gidaririk ematen. Talde bakoitzak bakarrik konpontzen du.
Memoria-erabilera: spaCy ereduak RAM-era kargatzen dira instantzia bakoitzeko. `en_core_web_lg` eredu soilik 741 MB da. Memoria-presioa pean, errendimendua jaisten da. Ondoren prozesuak memoria-akabatze errore batekin huts egiten du. Presidio-k ez du honen inguruko barneko gidaritasunik.
Denborak: Dokumentu handiek denbora gehiago behar dute. Produkzio-kodeak denbora konfiguragarria, denbora-irauntzaren erantzun seguruak eta saiakera-logika behar ditu. Hau guztia Presidio-n ez dago dokumentatua.
Eredu-kargatzeko porrotak: Konkurrentzia altu pean, hainbat langilek spaCy eredu bera aldi berean kargatzen saiatzen dira. Hau arraza-baldintza da. Emaitza erreproduzitu zaila den ausazko 500 erroreak dira. Presidio GitHub-eko arazoak hau dokumentatzen du. Dokumentazio nagusiak ez du.
Auditoria-erregistroak: GDPRek eta HIPAAk PII prozesatzeko auditoria-ibilbideak eskatzen dituzte. Presidio-k ez du barneko erregistrorik. Talde bakoitzak bere middleware-a idatzi behar du.
API bertsiotzea: Presidioren APIa bertsio artean aldatu da. Presidio 2.0rako eraikitako kodeak 2.2 eta gorago eguneratzeak behar ditu. Bertsio-geldiarazpena laguntzen du. Baina bere mantentze-karga gehitzen du.
Osasun SaaS Taldearen Sei Astea
Talde honek PHI anonimizazioa ikerketa-datu esportazio bide batean eraiki zuen.
1. astea: Presidio dokumentuak jarraitu zituzten. Tokiko garapena funtzionatu zuen. Kubernetes hedapenak huts egin zuen. Pod-aren hasieratzeak eredu-kargatzeko erroreak sortu zituen. Taldeak Kubernetes konfigurazio arazoak bilatu zituen.
2. astea: Kubernetes konfigurazioa konponduta. Eredu-kargatzea noizean behin funtzionatzen zuen. Karga-probapean, eskaeren %15 inguru eredu-kargatzeko denborak igarotzen zuten. Saiakera-logika gehitu zuten.
3. astea: Saiakera-logikak erroa ezkutatu zuen baina karga-probak gainditu zituen. Betetze-berrikusketa batek auditoria-erregistroak eskatu zituen. Taldeak middleware pertsonalizatua idatzi zuen.
4. astea: Osasun-entitate motak - mediku-erregistro zenbakiak, osasun-plan IDak - Presidio lehenetsiak estaltzen ez zituen. Taldeak bi ezagutzaile pertsonalizatu idatzi zituen.
5. astea: Produkziora eraman zuten. Memoria-ihes bat agertu zen. spaCy eredu-objektuak eskaeren artean pilatu ziren. Taldeak eguneroko pod berrabiaraztea konponbide gisa gehitu zuen.
6. astea: Produkzioak benetako trafikopean huts egin zuen. Eguneroko berrabiarazteak zerbitzu-tarteak sortu zituen. Erroa argia zen: memoria-ihesak aplikazioaren berreraikitze nagusia edo tresna ezberdin bat behar zituen.
Berrikuspena: Ingeniaritza-kudeatzaileak zenbakiak atera zituen. Sei aste bider bi ingeniari hamabi ingeniaritza-astetan ematen da. Hedapena bizian zegoen baina ezegonkorra. Urteko mantentze-lana asteko 5 eta 10 ordu bitartean estimatu zen.
Aldaketa: Taldeak anonym.legal APIa probatu zuen. PHI entitate-estalpena kutxatik atera zen. Ez ziren ezagutzaile pertsonalizaturik behar. SLAz babestutako uptime. Auditoria-erregistroa barne. Integrazioak 3 egun behar izaten zituen lehendik zegoen API bezero-kodea erabiliz.
Kostu-konparaketa:
- 12 ingeniaritza-aste AEBetako merkatuko tasen arabera: 48.000 eta 72.000 dolar artean
- Autobertako urteko mantentze estimatua: 25.000 eta 40.000 dolar artean
- anonym.legal Business plana: 348 euro/urte (gutxi gorabehera 385 dolar)
Kudeatu APIak lehen astean baino gutxiago kostatzen du autobertako eraikuntza lehen orduan baino.
Datuak Zure Saretik Atera Ezin Direnean
Osasun-talde batzuek ezin dituzte datuak kanpoko zerbitzu batera bidali. Aire-gune arauak edo datu-subiranotasun politikek blokeatzen dute.
Kasu hauetarako, Desktop Aplikazioak (anonym.plus) motor bera eskaintzen du tokiko instalazio batean:
- Detekzio-motor bera: Presidio gehi XLM-RoBERTa
- Ez du kanpoko zerbitzuetara deirik egiten
- Kliniko-oharren eta ikerketa-datu-multzo batcheko prozesatzea
- Instalazioa baino konfigurazio gehiago ez
- Ereduaren kudeaketa automatikoa
Horrek kudeatu SaaS-en eragozpen nagusia kentzen du: "gure datuak ezin dira irten." Oraindik kudeatu tresnak merezi duten sinpletasuna gordetzen du.
Eraikitzen vs Erostea: Esparru Sinplea
Kudeatu API bat aukeratu noiz:
- Zure taldeak ez dauka azpiegitura-ingeniari dedikaturik
- Egunetan zehar bidali behar duzu, ez astetan
- SLAz babestutako uptime eskakizuna da
- Kudeatu zerbitzuak zure entitate-motak estaltzen ditu
- Auditoria-erregistroak eta betetze-erregistroak barne behar dituzu
Autobertako ostatzea aukeratu noiz:
- Araupeek datuak zure saretik irtetea blokeatzen dute (Desktop App-a lehenik egiaztatu)
- Zure prozesatze-bolumena autobertako prozesatzea eskalan merkeago egiten du
- APIak onartzen ez duen pertsonalizazio sakona behar duzu
- Zerbitzuetako bat bezala tratatzen duen plataforma-taldea daukazue
Desktop Aplikazioa aukeratu noiz:
- Konektatu gabeko prozesatzea beharrezkoa da
- Mediku-ikerketa-datuak ezin dira ingurune kliniko batetik irten
- Finantza-datuek prozesatze-muga geografikoak dituzte
Ondorioa
Sei asteko ingeniaritza-denbora ez da Presidio-ren akats bat. Edozein produkzio-mailako NLP zerbitzuren exekutatze-kostu espero da. Eskalatzea, memoria-arazoak, eredu-kargatzeko porrotak, auditoria-erregistroak eta entitate-lan pertsonalizatua azkar batzen dira.
Kudeatu APIek kostu hori xurgatzen dute. PII anonimizaziorako - betetze-eskakizuna, ez produktu-eginbide bat - kudeatu bidea ia beti irabazten du jabetza-kostu totalean.
Irakurri anonym.legal APIak PHI detekzioa nola kudeatzen duen. Ikusi betetze-xehetasunak guztiak gure segurtasun ikuspegi orokorrean. Konparatu planak gure prezio-orrian.
Iturriak
- Ploomber: Presidio Production Deployment Deep Dive - ploomber.io.
- Microsoft Fabric Community: Presidio with PySpark - blog.fabric.microsoft.com.
- Presidio GitHub: Production Deployment Issues - github.com/microsoft/presidio/issues.