anonym.legal

By · Last updated 2026-06-05

Înapoi la BlogTehnic

Detecția gratuită a PII costă €13.000/an

Auto-găzduirea Presidio necesită 40-80 de ore de configurare inițială și 5-10 ore/lună de mentenanță continuă. La tarife de inginerie de €100/oră, asta înseamnă €13.200+.

June 5, 20267 min citire
Presidio TCOopen-source costmanaged SaaSPII infrastructureDevOps cost

Costul real al detecției PII „gratuite”

„Este gratuit” nu este o analiză de cost. Este un preț de licență — un factor printre mulți.

Microsoft Presidio costă €0 de descărcat. Software-ul este open-source. Dar rularea lui la o companie de asigurări costă peste €13.000 în primul an. Acel decalaj este timp de inginerie.

Ce necesită o implementare în producție

Pregătirea instrumentului pentru producție ia 40–80 de ore. Iată unde se duc acele ore.

Configurare Docker: 4–8 ore. Instrumentul folosește mai multe containere. Un serviciu analizor, un serviciu anonimizor și un redactor de imagini opțional. A le face să comunice între ele este dificil. Problemele de pe GitHub arată că este un punct de eșec comun.

Configurare Python: 2–4 ore. Bibliotecile au reguli stricte de versiune. Conflictele sunt frecvente — în special între versiunile de modele spaCy și Python 3.8/3.9/3.10. GitHub arată sute de probleme deschise pe această temă.

Descărcări de modele de limbaj: 2–4 ore. Modelele spaCy variază de la 300 MB la 1,4 GB fiecare. O configurare cu cinci limbi necesită 1,5–7 GB de stocare. Eșecurile de încărcare a modelelor sunt printre cele mai frecvente probleme de suport.

Recunoaștoare personalizate: 8–16 ore. Setul implicit acoperă aproximativ 40 de tipuri de entități. Cele mai multe sunt identificatori SUA. Implementările UE au nevoie de ID-uri naționale europene. Echipele de sănătate au nevoie de formate de înregistrări medicale. Fiecare tip necesită cod Python, configurare YAML și testare.

Configurare API: 4–8 ore. Configurarea de producție include timeout-uri, autentificare, limite de rată și jurnalizare. Documentația oficială este slabă. Cele mai multe echipe găsesc răspunsuri în firele de probleme de pe GitHub.

Jurnalizare audit: 4–8 ore. GDPR necesită înregistrări ale procesării datelor. Instrumentul nu are jurnal de audit implicit. Echipele trebuie să-l scrie ca cod personalizat.

Documentare echipă: 4–8 ore.

Total configurare inițială: 28–52 ore la €100/oră = €2.800–5.200.

Costurile anuale de mentenanță

Instrumentul livrează actualizări de 2–4 ori pe an. Versiunile majore au rupt API-uri. Menținerea la zi înseamnă urmărirea modificărilor, testarea în staging și implementarea.

Actualizările modelelor spaCy adaugă și ele muncă. Noile versiuni de modele trebuie re-descărcate și verificate ca acuratețe înainte de a fi puse în producție.

Conflictele de dependențe Python continuă. O configurare curată astăzi poate să se strice când un patch de securitate este livrat luna viitoare.

Monitorizarea este continuă de asemenea. Sănătatea containerelor, scurgerile de memorie și pașii de repornire necesită toți atenție regulată. Modelele spaCy sunt intensive în memorie.

Total mentenanță anuală: 60–120 ore la €100/oră = €6.000–12.000.

Un studiu de caz din lumea reală

O echipă de conformitate la o companie de asigurări a pornit să proceseze documente de cereri de despăgubire. Aveau doi ingineri de date juniori și niciun suport DevOps.

Săptămâna 1. Cele două containere principale nu puteau comunica. Trei zile pentru a rezolva cu ajutor de pe GitHub.

Săptămâna 2. Modelele nu s-au încărcat în producție. Configurarea memoriei era diferită față de configurarea de dezvoltare. Două zile pentru diagnostic, încă una pentru reparare.

Săptămâna 3. O regulă personalizată pentru Numărul Național de Asigurări din UK funcționa în teste, dar producea fals pozitive pe documente reale. Încă două zile de ajustare.

Săptămâna 4. Proiectul a fost escaldat. Trei săptămâni de inginerie consumate. Încă nu era în producție.

Echipa a încercat apoi anonym.legal. Primul document procesat: 12 minute după înregistrare. Detecția Numărului Național de Asigurări din UK era deja încorporată. Nu era necesară nicio configurare.

S-au mutat la anonym.legal Professional la €180/an.

TCO în primul an:

  • Calea auto-găzduită — 40–80 de ore suplimentare pentru finalizare, apoi €6.000–12.000/an pentru mentenanță. Total: €10.000–20.000.
  • anonym.legal Professional — €180/an. Timp de implementare: ~12 minute.
  • Ore de inginerie economisite: ~132/an la €100/oră = €13.200.

Acesta este un decalaj de cost de 70x în primul an.

Pentru echipele care se confruntă și cu probleme de fals pozitive, consultați postarea noastră despre problema de precizie a Presidio.

Când auto-găzduirea are sens

SaaS-ul gestionat câștigă pentru cele mai multe echipe. Dar auto-găzduirea se potrivește unor cazuri.

Suveranitatea datelor. Unele reguli sau contracte interzic trimiterea datelor în afara. Aplicația noastră Desktop (anonym.plus) rulează complet offline. Nicio dată nu părăsește mașina. Aceeași acuratețe, fără server necesar.

Volum foarte ridicat. Milioane de apeluri API pe zi pot împinge prețul per apel peste costurile de server. La acea scară, deținerea stivei are sens.

Integrare de produs. Construiești detecția PII în propriul tău produs și ai nevoie de control complet? Munca personalizată open-source este validă aici.

DevOps existent. Echipele cu o echipă de platformă care rulează deja multe servicii se confruntă cu un cost adăugat mai mic. Infrastructura este un cost scufundat pentru ele.

Pentru toți ceilalți — echipe de conformitate, startup-uri, echipe fără DevOps — SaaS-ul gestionat este alegerea clară. Consultați prezentarea noastră de conformitate în securitate pentru cum procesarea găzduită îndeplinește nevoile întreprinderilor.

Concluzie

Instrumentele open-source au costuri care nu apar în licență. Pentru acest tip de instrument, costul mare este timpul de inginerie. Configurare: 40–80 de ore. Mentenanță anuală: 60–120 de ore. La tarifele normale, calea auto-găzduită costă de 20–75x mai mult decât un serviciu gestionat.

Întrebarea corectă nu este „cât costă software-ul?” Este „cât costă rularea lui?” Pentru cele mai multe echipe, acel răspuns indică spre SaaS gestionat.

Surse

Microsoft Presidio GitHub: Probleme și documentație de configurare. VERIFICAT-EXTERN.

Ploomber: Ghid de implementare Presidio în producție. VERIFICAT-EXTERN.

GDPR Articolul 32: Măsuri tehnice pentru securitate adecvată. VERIFICAT-EXTERN.

Pregătit să vă protejați datele?

Începeți să anonimizati PII cu 285+ tipuri de entități în 48 de limbi.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.