anonym.legal
Nazaj na blogTehnično

Od 6 Tednov Devops Pekla do 3-Dnevne Integracije...

Zdravstveni SaaS timski inženirje preživijo 6 tednov pri samogostovanju Presidio uvajanja v produkcijo, preden se preklopijo na upravljan API.

April 21, 20267 min branja
managed PII APIPresidio productionPHI anonymizationhealthcare SaaSbuild vs buy

Od 6 Tednov Devops Pekla do 3-Dnevne Integracije: Primer za Upravljane API-je za Osebne Podatke

Poslo-primer za gradnjo proti nakupu infrastrukture za anonimizacijo osebnih podatkov je redko analiziran s strogostjo. "Brezplačni" odprtokodnih in zaznani nadzor samogostovane infrastrukture naredita gradnjo privlačno, dokler inženirska realnost ne udari.

šest tednov. Dva inženirja. Štiri neuspešna poskus uvajanja. Zdravstveni SaaS podjetja je njegov inženirski tim preživel to na samogostujočem Presidio preden se prebil na upravljan API, ki je nadomestil uvajanje v 3 dni.

Kaj Presidio-jevo Dokumentacija Ne Pove o Produkciji

Presidio-jeva dokumentacija pokriva lokalno razvojno nastavitev celovito. Zaženite dva Docker zabojnika, usmerite anonimizator v analizator, obdelajte besedilo. To deluje v lokalnem razvojnem okolju.

Uvajanje v produkcijo je drugačno:

Skaliranje: Lokalni Presidio teče ena-instančne. Produkcija zahteva več primerov za povratno ročko, zdravstvenim preverjanjem in lepo degradacijo, ko primerov ne uspe. Presidio-jeva dokumentacija ne zagotavlja smernic za vodoravno skaliranje. Vsaka organizacija to reši neodvisno.

Upravljanje pomnilnika: Modeli spaCy jezika so naloženi v pomnilnik na instanco. Veliki jezični modeli (en_core_web_lg: 741MB) porabljajo bistveno RAM. Pritisk pomnilnika povzroči postopno zmanjšanje zmogljivosti in končne OOM napake. Presidio ima nobenega vgrajenega navodila za upravljanje pomnilnika.

Obdelava prekoročitev časa: Veliki dokumenti trajajo dlje za obdelavo. Produktivni časovni okvir za zahtevo/odziv je pogosto kratke – 30 sekund, preden se zahteva poteče. Presidio ima omejene nastavitve za povečanje časovnega okvira brez ročne upravljanja.

Diagnostika napak: Ko Presidio ne uspe, je sporočilo o napaki pogosto generično. Bi pa razlozilo ali je Problem v pomnilniku, časovanju, konfiguraciji ipd. Inženirji preživijo ure v razhroščevanju.

To je razlog, zakaj samogostovanje Presidio v produkciji običajno traja 6-8 tednov in zahteva 40-80 inženirskih ur. Upravljani API zamenja vse to s 3-dnevno integracijo.

Stroški Samogostovanja

Čas inženirja (初期 setup): 40-80 ur pri €150/uro = €6,000-€12,000

Nadaljnje vzdrževanja: 5-10 ur mesečno pri €100/uro = €600-€1,200/mesec = €7,200-€14,400/leto

Infrastruktura: €200-€500/mesec za strežnike, shranjevanje, pasovna širina = €2,400-€6,000/leto

Skupaj 1. leto: €15,600-€32,400

Skupaj 2. leto in senare: €9,600-€20,400/leto samo za vzdrževanja

Upravljani API: €180-€348/leto, brez vzdrževanja.

Razlika: €9,200-€32,220 v prvem letu, €9,252-€20,220 v naslednjih letih.

Kaj je Pridobljeno s Samogostovanjem

Samogostovanje je smiselno, če imate:

  1. Posebne zahteve za podatkovne pristojnosti: Podatki se nikoli ne smejo zapustiti posebne infrastrukture
  2. Omejeni budi za zunanje API-je: Predpisi prepovedujejo povezovanje zunanjih storitev
  3. Obsežno prilagodljivo zaznavo: Zahtevate 20+ prilagojenih prepoznavalnikov

Za večino organizacij te omejitve ne veljajo. Upravljani API je bolj kot to čas inženirja je redkost in dragocenega.

Ste pripravljeni zaščititi svoje podatke?

Začnite z anonimizacijo PII z več kot 285 tipi entitet v 48 jezikih.