By · Last updated 2026-06-05

Atpakaļ uz BloguTehniskā

Bezmaksas PII noteikšana izmaksā 13 000 EUR/gadā

Presidio pašhostēšana prasa 40–80 stundas sākotnējai iestatīšanai un 5–10 stundas/mēnesī pastāvīgai uzturēšanai. Pie 100 EUR/stundā inženieru likmēm tas ir 13 200 EUR un vairāk.

June 5, 20267 min lasīšanai
Presidio TCOopen-source costmanaged SaaSPII infrastructureDevOps cost

Reālās "bezmaksas" PII noteikšanas izmaksas

"Tas ir bezmaksas" nav izmaksu analīze. Tā ir licences cena — viens faktors no daudziem.

Microsoft Presidio lejupielāde izmaksā 0 EUR. Programmatūra ir atvērtā pirmkoda. Taču tā darbināšana apdrošināšanas uzņēmumā pirmajā gadā izmaksā vairāk nekā 13 000 EUR. Šī starpība ir inženieru laiks.

Kas nepieciešams ražošanas izvietošanai

Rīka sagatavošana ražošanai aizņem 40–80 stundas. Lūk, kur tiek tērēts šis laiks.

Docker iestatīšana: 4–8 stundas. Rīks izmanto vairākus konteinerus. Analizatora pakalpojums, anonimizatora pakalpojums un izvēles attēlu redaktors. Panākt, lai tie sazinātos savā starpā, ir grūti. GitHub problēmas rāda, ka tas ir izplatīts kļūmes punkts.

Python iestatīšana: 2–4 stundas. Bibliotēkām ir strikti versiju noteikumi. Konflikti ir izplatīti — jo īpaši starp spaCy modeļu versijām un Python 3.8/3.9/3.10. GitHub rāda simtiem atvērtu problēmu par šo tēmu.

Valodu modeļu lejupielāde: 2–4 stundas. spaCy modeļi svara no 300 MB līdz 1,4 GB katrs. Piecu valodu iestatīšanai nepieciešams 1,5–7 GB krātuve. Modeļu ielādes kļūmes ir vienas no visizplatītākajām atbalsta problēmām.

Pielāgoti atpazinēji: 8–16 stundas. Noklusējuma kopa aptver aptuveni 40 entītiju tipus. Lielākā daļa ir ASV identifikatori. ES izvietošanai nepieciešami Eiropas nacionālie ID. Veselības aprūpes komandām nepieciešami medicīnisko ierakstu formāti. Katrs veids prasa Python kodu, YAML iestatīšanu un testēšanu.

API iestatīšana: 4–8 stundas. Ražošanas konfigurācija ietver taimauti, autentifikāciju, ātruma ierobežojumus un žurnālu reģistrēšanu. Oficiālā dokumentācija ir vāja. Lielākā daļa komandu atradnes atrod GitHub problēmu pavedienos.

Audita žurnālu reģistrēšana: 4–8 stundas. GDPR prasa datu apstrādes ierakstus. Rīkam pēc noklusējuma nav audita žurnāla. Komandām tas jāraksta kā pielāgots kods.

Komandas dokumentācija: 4–8 stundas.

Kopējā sākotnējā iestatīšana: 28–52 stundas pie 100 EUR/stundā = 2 800–5 200 EUR.

Gada uzturēšanas izmaksas

Rīks piegādā atjauninājumus 2–4 reizes gadā. Lielākie izlaidumi ir pārkāpuši API. Sekošana līdzi nozīmē izmaiņu izsekošanu, testēšanu uzstādīšanas vidē un izvietošanu.

spaCy modeļu atjauninājumi pievieno papildu darbu. Jauno modeļu versiju pirms pārejas uz dzīvo vidi ir jālejupielādē un jāpārbauda precizitāte.

Python atkarību konflikti turpinās. Šodien tīra iestatīšana var sabojāties, kad nākammēnes tiek piegādāts drošības ielāps.

Monitorings arī ir pastāvīgs. Konteineru veselība, atmiņas noplūdes un restartēšanas soļi visi prasa regulāru uzmanību. spaCy modeļi ir atmiņā ietilpīgi.

Kopējā gada uzturēšana: 60–120 stundas pie 100 EUR/stundā = 6 000–12 000 EUR.

Reālās pasaules gadījuma izpēte

Apdrošināšanas uzņēmuma atbilstības komanda nolēma apstrādāt prasību dokumentus. Viņiem bija divi junior datu inženieri un neviens DevOps atbalsts.

1. nedēļa. Divi galvenie konteineri nevarēja sazināties. Trīs dienas, lai labotu ar GitHub palīdzību.

2. nedēļa. Modeli ielādēties ražošanā neizdevās. Atmiņas konfigurācija atšķīrās no izstrādes iestatīšanas. Divas dienas diagnosticēšanai, vēl viena labošanai.

3. nedēļa. Pielāgota Lielbritānijas Nacionālās apdrošināšanas numura kārtula darbojās testos, bet reālos dokumentos saskārās ar viltus pozitīviem rezultātiem. Vēl divas dienas regulēšanai.

4. nedēļa. Projekts tika eskalēts. Trīs inženieru nedēļas pavadītas. Vēl nav ražošanā.

Komanda pēc tam izmēģināja anonym.legal. Pirmais apstrādātais dokuments: 12 minūtes pēc reģistrācijas. Lielbritānijas Nacionālās apdrošināšanas numura noteikšana jau bija iebūvēta. Iestatīšana nebija nepieciešama.

Viņi pārgāja uz anonym.legal Professional par 180 EUR/gadā.

Pirmā gada TCO:

  • Pašhostēta ceļš — vēl 40–80 stundas pabeigšanai, tad 6 000–12 000 EUR/gadā uzturēšanai. Kopā: 10 000–20 000 EUR.
  • anonym.legal Professional — 180 EUR/gadā. Izvietošanas laiks: ~12 minūtes.
  • Ietaupītās inženieru stundas: ~132/gadā pie 100 EUR/stundā = 13 200 EUR.

Tas ir 70x izmaksu starpība pirmajā gadā.

Komandām, kas arī saskaras ar viltus pozitīvo rezultātu problēmām, skatiet mūsu ierakstu par Presidio precizitātes problēmu.

Kad pašhostēšana ir jēgpilna

Pārvaldītais SaaS uzvar lielākajai daļai komandu. Taču pašhostēšana der dažos gadījumos.

Datu suverenitāte. Daži noteikumi vai līgumi aizliedz datu nosūtīšanu ārpus valsts. Mūsu darbvirsmas lietotne (anonym.plus) darbojas pilnībā bezsaistē. Dati neatstāj iekārtu. Tāda pati precizitāte, serveris nav nepieciešams.

Ļoti liels apjoms. Miljoniem API izsaukumu dienā var paaugstināt cenu par izsaukumu virs serveru izmaksām. Tādā mērogā steka pārvaldīšana ir jēgpilna.

Produkta integrācija. Vai veidojat PII noteikšanu savā produktā un nepieciešama pilna kontrole? Pielāgots atvērtā pirmkoda darbs šeit ir pamatots.

Esošais DevOps. Komandām ar platformas komandu, kas jau pārvalda daudzus pakalpojumus, ir zemākas papildu izmaksas. Infrastruktūra ir viņiem jau segta izmaksa.

Visiem pārējiem — atbilstības komandām, jaunuzņēmumiem, komandām bez DevOps — pārvaldītais SaaS ir skaidra izvēle. Skatiet mūsu drošības atbilstības pārskatu, lai uzzinātu, kā hostēta apstrāde atbilst uzņēmuma vajadzībām.

Secinājums

Atvērtā pirmkoda rīkiem ir izmaksas, kas nelicences cenā neparādās. Šāda veida rīkam lielākā izmaksa ir inženieru laiks. Iestatīšana: 40–80 stundas. Gada uzturēšana: 60–120 stundas. Pie normālām likmēm pašhostēta ceļš izmaksā 20–75x vairāk nekā pārvaldīts pakalpojums.

Pareizais jautājums nav "cik maksā programmatūra?" Tas ir "cik maksā tās darbināšana?" Lielākajai daļai komandu šī atbilde norāda uz pārvaldītu SaaS.

Avoti

Microsoft Presidio GitHub: Problēmas un iestatīšanas dokumentācija. PĀRBAUDĪTS-ĀRĒJS.

Ploomber: Presidio ražošanas izvietošanas rokasgrāmata. PĀRBAUDĪTS-ĀRĒJS.

GDPR 32. pants: Tehniskie pasākumi atbilstošai drošībai. PĀRBAUDĪTS-ĀRĒJS.

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.