By · Last updated 2026-06-05

Späť na blogTechnické

Bezplatná detekcia PII stojí viac ako 13 000 EUR rocne

Vlastné hosťovanie Presidio vyzaduje 40-80 hodín pociatocného nastavenia a 5-10 hodín mesacnej údrzby. Pri hodinovej sadzbe inziniera 100 EUR je to viac ako 13 200 EUR.

June 5, 20267 min čítania
Presidio TCOopen-source costmanaged SaaSPII infrastructureDevOps cost

Skutocné náklady na "bezplatnú" detekciu PII

"Je to zadarmo" nie je analýza nákladov. Je to cena licencie — jeden z mnohych faktorov.

Microsoft Presidio stojí 0 EUR na stiahnutie. Softvér je open-source. Ale jeho prevadzkovanie v poisťovni stojí viac ako 13 000 EUR v prvom roku. Tento rozdiel je cas inziniera.

Co potrebuje nasadenie do produkcie

Príprava nástroja na produkciu trvá 40-80 hodín. Tu je rozpis, kam cas idde.

Nastavenie Docker: 4-8 hodín. Nástroj pouÎzíva niekoľko kontajnerov. Sluzba analyzátora, sluzba anonymizátora a volitelny redaktor obrázkov. Ich vzájomná komunikácia je narocná. Problémy na GitHub ukazujú, ze je to casty bod zlyhania.

Nastavenie Python: 2-4 hodiny. KniÍznice majú prísne pravidlá verzií. Konflikty sú casté — najmä medzi verziami modelu spaCy a Python 3.8/3.9/3.10. GitHub zobrazuje stovky otvorených problémov na túto tému.

Stiahnutie jazykových modelov: 2-4 hodiny. Modely spaCy majú velkost od 300 MB do 1,4 GB kazdy. Nastavenie pre 5 jazykov potrebuje 1,5-7 GB ulozného priestoru. Chyby pri nacítaní modelu patria medzi najcastejšie problémy podpory.

Vlastné rozpoznávace: 8-16 hodín. Predvolená sada pokryva asi 40 typov entít. Vacsina sú identifikátory USA. Nasadenia v EÚ potrebujú európske národné identifikacné císla. Tímy v zdravotníctve potrebujú formáty zdravotnych záznamov. Kazdy typ potrebuje kód Python, nastavenie YAML a testovanie.

Nastavenie API: 4-8 hodín. Produkcioná konfigurácia zahŕna casové limity, autentifikáciu, limity rýchlosti a logovanie. Oficiálna dokumentácia je strohá. Vacsina tímov nacháza odpovede vo vláknach problémov na GitHub.

Logovanie auditov: 4-8 hodín. GDPR vyzaduje záznamy o spracovaní dat. Nástroj predvolene nemá audit log. Tímy ho musia napísat ako vlastný kód.

Dokumentácia tímu: 4-8 hodín.

Celkové pociatocné nastavenie: 28-52 hodín pri 100 EUR/hod = 2 800-5 200 EUR.

Rocné náklady na údrzbu

Nástroj vydáva aktualizácie 2-4-krát rocne. Hlavné vydania prerušili API. Udrzovanie kroku znamená sledovanie zmien, testovanie v stagingu a nasadzovanie.

Aktualizácie modelu spaCy pridávajú dalšiu prácu. Nové verzie modelov treba znovu stiahnut a skontrolovat presnost pred spustením do prevádzky.

Konflikty závislostí Pythonu pokracujú. Cistá inštalácia dnes môze mat problém, ked zajtra príde bezpecnostná záplata.

Monitorovanie je taktiez priebezné. Zdravotny stav kontajnerov, úniky pamate a kroky reštartu si vyzadujú pravidelnú pozornost. Modely spaCy su pamatovo narocné.

Celková rocná údrzba: 60-120 hodín pri 100 EUR/hod = 6 000-12 000 EUR.

Prípadová štúdia z praxe

Tím zodpovedny za súlad v poisťovni sa rozhodol spracovávat dokumenty o poistnych udalostiach. Mali dvoch junior dátovych inzinierov a ziadnu DevOps podporu.

1. tyzden. Dva hlavné kontajnery nemohli komunikovat. Tri dni na opravu s pomocou GitHubu.

2. tyzden. Modely sa nepodarilo nacítat v produkcii. Konfigurácia pamate bola odlišná od vývojového nastavenia. Dva dni diagnózy, další den opravy.

3. tyzden. Vlastné pravidlo pre britské Nationale Insurance Number fungovalo v testoch, ale spôsobovalo falošné poplachy pri skutocnych dokumentoch. Dalšie dva dni ladenia.

4. tyzden. Projekt bol eskalovaný. Prešli tri inzinierske tyzdne. Stale nie v produkcii.

Tím potom vyskúšal anonym.legal. Prvý dokument bol spracovany 12 minút po registrácii. Detekcia britského National Insurance Number bola uz zabudovaná. Ziadne nastavenie nebolo potrebné.

Prešli na anonym.legal Professional za 180 EUR/rok.

Celkové náklady vlastníctva v prvom roku (TCO):

  • Vlastnohodená cesta — 40-80 dalších hodín na dokoncenie, potom 6 000-12 000 EUR/rok na údrzbu. Celkovo: 10 000-20 000 EUR.
  • anonym.legal Professional — 180 EUR/rok. Cas nasadenia: ~12 minút.
  • Ušetrené inzinierske hodiny: ~132/rok pri 100 EUR/hod = 13 200 EUR.

To je 70-násobny rozdiel nákladov v prvom roku.

Pre tímy celjúce aj problémom s falošnymi poplachmi pozri náš príspevok o probléme presnosti Presidio.

Kedy má zmysel vlastné hosťovanie

Spravovaný SaaS vyhráva pre vacsinu tímov. Ale vlastné hosťovanie sa hodí v niektorych prípadoch.

Dátová suverenita. Niektoré pravidlá alebo zmluvy zakazujú odosielanie dát von. Naša desktopová aplikácia (anonym.plus) beží plne offline. Ziadne dáta neopustia zariadenie. Rovnaká presnost, bez potreby servera.

Velmi vysoky objem. Milióny volání API denne môzu potlacit cenovanie za volanie nad náklady na server. V takomto meradle má zmysel vlastnit zásobník.

Integrácia do produktu. Budujete detekciu PII do vlastného produktu a potrebujete plnú kontrolu? Vlastná práca na open-source je tu platná.

Existujúci DevOps. Tímy s platformovym tímom, ktory uz prevadzKuje mnoho sluzieb, celía nizším pridanym nákladom. Infraštruktúra je pre ne topeny náklad.

Pre všetkych ostatnych — tímy súladu, startupy, tímy bez DevOps — je spravovany SaaS jasnou volbou. Pozrite si náš prehlad súladu bezpecnosti, ako hosťované spracovanie splna podnikové potreby.

Záver

Open-source nástroje majú náklady, ktore sa neobjavujú v licencii. Pre tento typ nástroja je hlavnym nákladom cas inziniera. Nastavenie: 40-80 hodín. Rocná údrzba: 60-120 hodín. Pri beinznych sadzbách stojí vlastnohodená cesta 20-75-krát viac ako spravovaná sluzba.

Spravná otázka nie je "Colko stojí softvér?" Je to: "Co stojí jeho prevádzkovanie?" Pre vacsinu tímov táto odpoved ukazuje na spravovany SaaS.

Zdroje

Microsoft Presidio GitHub: Problémy a dokumentácia nastavenia.

Ploomber: Pruvodca nasadením Presidio do produkcie.

GDPR clanok 32: Technické opatrenia pre primeranú bezpecnost.

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.