By · Last updated 2026-06-05

Späť na blogTechnické

Problem presnosti Presidio: 22,7 % falošnych poplachov

Benchmark z roku 2024 zistil, ze rozpoznávac mien osob v Presidio dosahuje presnost 22,7 % v obchodnych dokumentoch — co znamená, ze 77,3 % detekcií su falošné poplachy.

June 5, 20267 min čítania
Presidio precisionfalse positivesNER accuracyPII detection qualityhybrid recognizer

Problem presnosti Presidio: 22,7 %

Falošné poplachy pri detekcii PII spôsobujú skutocnú škodu. Ked 77,3 % toho, co váš nástroj oznací ako "mená osob", nie sú skutocné mená, nechránite sukromie. Nicíte dáta.

Benchmark z roku 2024 testoval predvoleny model NER v Microsoft Presidio na obchodnych dokumentoch. Test zahŕnal financné správy, dopisy zákazníkom, dokumentáciu produktov a tikety podpory. Výsledok: presnost 22,7 % pre detekciu mien.

Toto cislo je zarážajúce. Na každych 100 oznacenych poloziek je 23 skutocnych individuálnych mien. Zvysnych 77 su falošné poplachy — názvy produktov, firemné pojmy alebo názvy miest.

Tri zo štyroch detekcií su chybné. To nie je menší problém kalibrácie. To je nefunkcny nástroj pre prácu s obchodnymi dokumentmi.

Preco k tomu dochádza

Presidio pouzíva predvolene model spaCy en_core_web_lg. Tento model sa ucil na novinarskych textoch. V správach sú vacsina vlastných podstatnych mien skutocné osoby alebo miesta.

Obchodné dokumenty su iné.

Nálepky produktov, ktore vyzerjú ako mená osob. "Záznamy o dodávkach Apple iPhone 15 Pro" su oznacené ako PERSON. Rovnako aj "Samsung Galaxy Tab" a "nasadenie Cisco Meraki".

Firemné pojmy s castami podobnymi menám. V "vysledkoch Johnson Controls" je slovo "Johnson" oznacené ako PERSON. "Portfólio Goldman Sachs" spúšta rovnakú chybu.

Nálepky umiestnení, ktore spúšajú detekciu osob. "Projekt Victoria Harbour" oznacuje "Victoria" ako PERSON. "Hub Santiago" oznacuje "Santiago" rovnakym spôsobom.

Modelu chybá kontext na rozlíšenie "Apple" (spolocnost) od "Apple Smitha" (osoba). Táto medzera je prícihou vacsiny falošnych poplachov. Novinársky text ho naucil zaobchadzat s vlastnymi podstanymi menami ako s ludmi alebo miestami. Obchodny text toto pravidlo porušuje stále.

Nasledky v praxi

Dátová firma pouzívala Presidio na cistenie prieskumov zákazníkov pred ich zdielaním. Audit odhalil štyri problémy. Po prvé, 40 % prieskumov malo chybne odstranené nálepky produktov. Po druhé, nálepky miest boli odstrânené z každej odpovede. Po tretie, zmienky o znackách boli vymazané z analytickej sady. Po štvrté, sentiment ohladom konkrétnych produktov nebolo mozné cítat.

Analyticky tím dostal zredigovaný text so všetkymi odstrânenymi odkazmi na produkty. Prieskum pôvodne menoval iPhone Pro a nabijacku Apple. Tento vyznam zmizel.

Firma nechránila sukromie lepšie. Nicila dáta bez získania súladu. Presidio bolo po audite nahradené.

Pozrite si náš prehlad súladu, ako kvalita detekcie ovplyvnuje vás regulacny stav.

Lepší prístup: hybridná detekcia

Tento problem nie je jedinecny pre Presidio. NER na úrovni tokenov bez kontextu bude mat tento problem vzdy. Opravou je detekcia zohladnujúca kontext.

Preco transformery pomáhajú: Model ako XLM-RoBERTa citá celú vetu. "Apple oznámil svoje zárobky" — Apple je firma. "Apple Smith nastúpil do tímu" — Apple je krstné meno. Kontext vám povie, ktore je ktore.

To zlepšuje presnost pri zachovaní vysokej úplnosti. Pozrite si porovnanie niz šie.

PrístupPresnostÚplnost
Predvolená NER Presidio22,7 %~85 %
Len regex~95 %~40 %
Hybridna (Regex + NLP + Transformer)~85 %~80 %

Hybridny prístup dosahuje presnost 85 %. To znamená 15% mieru falošnych poplachov. Omnoho lepsie ako 77,3 %. Pre obchodné dokumenty na tomto rozdiely záleží.

Hybridny zásobník má štyri kroky:

  1. Vrstva regex: Nachádzá štruktúrované ID — emaily, telefónne císla, SSN, IBAN. Formáty su pevne dané, takze falošné poplachy su zriedkavé. Prebehne ako prvá.

  2. Vrstva NLP (spaCy): Standardná NER pre ludí, firmy a miesta. Vysoká úplnost, niz šia presnost.

  3. Vrstva transformera (XLM-RoBERTa): Prehodnotí kazdy výsledok NLP pomocou kontextu celej vety. "Apple" v kontexte produktu stráca skóre entity. "John" v texte staznosti ho získava.

  4. Prah spolahlivosti: Do výstupu prejdú len výsledky nad nastavenym skóre. Zvýšte prah pre analytické prípady pouÎzitia. Znizite ho pre de-identifikáciu podla HIPAA.

Výsledky po prechode

Analytická firma prešla na hybridnú detekciu. Zisky boli jasné. Falošné poplachy nálepiek produktov klesli zo 40 % na 3 %. Falošné poplachy nálepiek miest klesli takmer na nulu. Skutocná úplnost identity zostala na ~82 %, mierne pod 85 %, ale presnost sa výrazne zlepšila.

Prieskumy sa stali znova pouÎzitelnymi. "iPhone", "Apple", "Samsung" a "Chicago" zostali v texte. Mená zákazníkov v kontexte stazností boli správne odstranené.

Hybridná detekcia vyzaduje viacej výpoctov. Pri veľkych úlohách su doby behu o nieco dlhsie. Pre vacsinu obchodnych prípadov pouÎzitia je zisk presnosti za to. Firma mohla znova vykonávat analýzu. To bol celý zmysel prieskumnych dát.

Precítajte si o našom prístupe k detekcii v prehladu bezpecnosti.

Ked su vysoké miery falošnych poplachov prijatelné

Niektoré prípady uprednostnujú úplnost pred presnostou.

HIPAA Safe Harbor: Premeškanie skutocného pozitívu je porušením. Miera falošnych poplachov 10 % je v poriadku, ak skutocné PHI nikdy nechybí. Nadmerné odstranenie je bezpecnejšie ako nedostatocné.

Právna kontrola: Premeškanie privilegovaného kontaktu môze zbavit výsady. Falošné poplachy vyzadujú kontrolu, ale nevytvárajú zodpovednost.

Obchodná analytika: Nadmerné odstranenie stráca dáta bez zisku súladu. Tu viac záleží na presnosti. Pouzite hybridny prístup s vysokym prahom spolahlivosti. To zachová nálepky znaciek a pojmy miest vo výstupe. Odstrania sa len skutocné mená osob.

Spravná rovnováha závisí od vášho prípadu pouÎzitia. Nástroje, ktore vám umoznujú nastavit prah, vám dávajú kontrolu. Iadne jednotné predvolené nastavenie nefunguje v každom kontexte.

Pozrite si náš FAQ pre casteé otázky o prahoch a rezimoch detekcie.

Záver

Miera presnosti 22,7 % znamená, ze 3 zo 4 detekcií su chybné. Pre obchodné dokumenty to robí výstup nepouÎzitený na analýzu. Dáva aj falošnú istotu ohladdom súladu.

Hybridná detekcia to opravuje. Kombinuje regex, NLP a hodnotenie transformerom. Dáta zostanú uÎzitocné po anonymizácii. Skutocné mená osob sú odstranené. Nálepky znaciek, pojmy miest a identifikátory produktov zostanú.

Ak ste opustili Presidio kvôli problémom s falošnymi poplachmi, toto je cesta vpred. Nie nová konfigurácia rovnakého modelu. Odlišná architektúra vytvorená pre kontexty obchodnych dokumentov.

Zdroje

Priva PII Benchmark 2024: Vyhodnotenie presnosti Presidio.

Microsoft Presidio: Podporované entity a architektúra modelu.

spaCy: Trénovacie dáta a obmedzenia en_core_web_lg.

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.