By · Last updated 2026-06-05

Atgal į BlogąTechninė

Nemokamas PII aptikimas kainuoja 13 000 EUR per metus

Presidio savęs talpinimas reikalauja 40–80 valandų pradinio diegimo ir 5–10 valandų per mėnesį priežiūros. 100 EUR/val. inžinerijos tarifu tai sudaro 13 200+ EUR.

June 5, 20267 min skaityti
Presidio TCOopen-source costmanaged SaaSPII infrastructureDevOps cost

Tikroji 'nemokamo' PII aptikimo kaina

'Tai nemokama' -- tai ne išlaidų analizė. Tai licencijos kaina -- vienas iš daugelio veiksnių.

Microsoft Presidio kainuoja 0 EUR parsisiuntimui. Programinė įranga yra atvirojo kodo. Tačiau ją paleidžiant draudimo kompanijoje pirmaisiais metais kainuoja daugiau nei 13 000 EUR. Ta spraga yra inžinerijos laikas.

Ko reikia gamybos diegimui

Įrankio paruošimas gamybai užima 40–80 valandų. Štai kur tas laikas eina.

Docker diegimas: 4–8 valandos. Įrankis naudoja kelis konteinerius. Analizatoriaus paslauga, anonimiškumo užtikrinimo paslauga ir pasirinktinis vaizdo redaktorius. Jas sujungti sunku. GitHub klausimai rodo, kad tai yra dažna nesėkmės vieta.

Python diegimas: 2–4 valandos. Bibliotekos turi griežtas versijų taisykles. Konfliktai yra įprasti -- ypač tarp spaCy modelių versijų ir Python 3.8/3.9/3.10. GitHub rodo šimtus atvirų klausimų šia tema.

Kalbos modelių atsisiuntimai: 2–4 valandos. spaCy modeliai sveria nuo 300 MB iki 1,4 GB kiekvienam. Penkių kalbų diegimui reikia 1,5–7 GB saugyklos. Modelių įkėlimo nesėkmės yra vienos iš dažniausių palaikymo problemų.

Pasirinktiniai atpažintuvai: 8–16 valandų. Numatytasis rinkinys apima apie 40 objektų tipų. Dauguma yra JAV identifikatoriai. ES diegimams reikalingi Europos šalių ID. Sveikatos priežiūros komandoms reikalingi medicinos įrašų formatai. Kiekvienas tipas reikalauja Python kodo, YAML diegimo ir testavimo.

API diegimas: 4–8 valandos. Gamybos konfigūracija apima laiko limitus, autentifikavimą, greičio apribojimus ir žurnalus. Oficiali dokumentacija yra menka. Dauguma komandų randa atsakymus GitHub klausimų gijose.

Audito žurnalavimas: 4–8 valandos. BDAR reikalauja duomenų apdorojimo įrašų. Įrankis pagal nutylėjimą neturi audito žurnalo. Komandos turi jį parašyti kaip pasirinktinį kodą.

Komandos dokumentacija: 4–8 valandos.

Iš viso pradinis diegimas: 28–52 valandos po 100 EUR/val. = 2 800–5 200 EUR.

Metinės priežiūros išlaidos

Įrankis siunčia atnaujinimus 2–4 kartus per metus. Pagrindiniai leidimai sulaužė API. Neatsilikimas reiškia keitimų stebėjimą, testavimą paruošamojoje aplinkoje ir diegimą.

spaCy modelių atnaujinimai taip pat prideda darbo. Naujų modelių versijų reikia parsisiųsti iš naujo ir patikrinti tikslumą prieš paleičiant.

Python priklausomybių konfliktai tęsiasi. Šiandien švari diegimas gali sulaužyti, kai kitą mėnesį bus išleistas saugos pleistras.

Stebėjimas taip pat yra nuolatinis. Konteinerio sveikata, atminties nutekėjimai ir paleidimo iš naujo žingsniai -- visa tai reikalauja reguliaraus dėmesio. spaCy modeliai reikalauja daug atminties.

Iš viso metinė priežiūra: 60–120 valandų po 100 EUR/val. = 6 000–12 000 EUR.

Realaus pasaulio atvejo analizė

Draudimo įmonės atitikties komanda ėmėsi apdoroti pretenzijų dokumentus. Turėjo du jaunesnius duomenų inžinierius ir jokio DevOps palaikymo.

1 savaitė. Du pagrindiniai konteineriai negalėjo bendrauti. Tris dienas taisė su GitHub pagalba.

2 savaitė. Modeliai nepavyko įkelti gamyboje. Atminties konfigūracija skyrėsi nuo kūrimo aplinkos. Dvi dienos diagnozei, dar viena taisymui.

3 savaitė. Pasirinktinė JK nacionalinio draudimo numerio taisyklė veikė testuose, bet tikruose dokumentuose davė klaidingai teigiamų. Dar dvi dienos derinimo.

4 savaitė. Projektas buvo eskaluotas. Praleistos trys inžinerijos savaitės. Vis dar ne gamyboje.

Komanda tada išbandė anonym.legal. Pirmas apdorotas dokumentas: 12 minučių po registracijos. JK nacionalinio draudimo numerio aptikimas jau buvo įdiegtas. Jokio diegimo nereikėjo.

Jie perėjo prie anonym.legal Professional už 180 EUR per metus.

Pirmų metų TCO:

  • Savęs talpinimo kelias -- 40–80 daugiau valandų pabaigimui, tada 6 000–12 000 EUR per metus priežiūrai. Iš viso: 10 000–20 000 EUR.
  • anonym.legal Professional -- 180 EUR per metus. Diegimo laikas: ~12 minučių.
  • Sutaupytos inžinerijos valandos: ~132 per metus po 100 EUR/val. = 13 200 EUR.

Tai 70 kartų išlaidų skirtumas pirmaisiais metais.

Komandoms, taip pat susidūrusioms su klaidingai teigiamų problemomis, žr. mūsų įrašą apie Presidio tikslumo problemą.

Kada savęs talpinimas turi prasmę

Valdoma SaaS laimi daugumai komandų. Tačiau savęs talpinimas tinka kai kuriems atvejams.

Duomenų suverenumas. Kai kurios taisyklės ar sutartys draudžia siųsti duomenis išorėn. Mūsų darbalaukio programa (anonym.plus) veikia visiškai neprisijungusi. Jokie duomenys nepalieka mašinos. Tas pats tikslumas, jokio serverio nereikia.

Labai didelis apimtis. Milijonai API iškvietimų per dieną gali viršyti vieno kvietime pagrįstą kainodarą, palyginti su serverio išlaidomis. Tokiu mastu savo paketo turėjimas yra pagrįstas.

Produkto integracija. Jei kuriate PII aptikimą į savo produktą ir jums reikalinga visa kontrolė -- tai pagrįstas atvirojo kodo individualus darbas.

Esama DevOps infrastruktūra. Komandos, turinčios platformos komandą, jau valdančią daugelį paslaugų, susiduria su mažesnėmis papildomomis išlaidomis. Infrastruktūra jiems yra patirtos išlaidos.

Visiems kitiems -- atitikties komandoms, pradedančiosioms įmonėms, komandoms be DevOps -- valdoma SaaS yra akivaizdus pasirinkimas. Žr. mūsų saugos atitikties apžvalgą apie tai, kaip talpinamas apdorojimas atitinka įmonių poreikius.

Išvada

Atvirojo kodo įrankiai turi išlaidų, kurios nematyti licencijoje. Šiam įrankio tipui didžiausia išlaidų dalis yra inžinerijos laikas. Diegimas: 40–80 valandų. Metinė priežiūra: 60–120 valandų. Įprastais tarifais savęs talpinimo kelias kainuoja 20–75 kartus daugiau nei valdoma paslauga.

Teisingas klausimas yra ne 'kiek kainuoja programinė įranga?' Tai 'kiek kainuoja ją paleisti?' Daugumai komandų tas atsakymas rodo į valdomą SaaS.

Šaltiniai

Microsoft Presidio GitHub: klausimai ir diegimo dokumentacija. PATIKRINTA IŠORIŠKAI.

Ploomber: Presidio gamybos diegimo vadovas. PATIKRINTA IŠORIŠKAI.

BDAR 32 straipsnis: Techninės priemonės tinkamam saugumui. PATIKRINTA IŠORIŠKAI.

Pasiruošę apsaugoti savo duomenis?

Pradėkite anonimizuoti PII su 285+ subjektų tipais 48 kalbomis.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.