By · Last updated 2026-06-05

Til baka á BloggTæknilegt

Nákvæmnivandinn í Presidio: 22,7%

Viðmiðunarprófun 2024 leiddi í ljós að nafnaþekkir Presidio nær 22,7% nákvæmni í viðskiptaskjölum — sem þýðir að 77,3% greininga eru falskt jákvæðar.

June 5, 20267 mín lestur
Presidio precisionfalse positivesNER accuracyPII detection qualityhybrid recognizer

Nákvæmnivandinn í Presidio: 22,7%

Falskt jákvæðar niðurstöður í PII-greiningu valda raunverulegum skaða. Þegar 77,3% af því sem verkfærið flaggar sem "persónunöfn" eru ekki raunveruleg nöfn, verndarðu ekki friðhelgi. Þú ert að eyðileggja gögn.

Viðmiðunarprófun árið 2024 prófaði sjálfgefið NER-líkan Microsoft Presidio á viðskiptaskjölum. Prófunin náði yfir fjárhagsskýrslur, viðskiptavinabréf, vöruskjöl og þjónustufyrirspurnir. Niðurstaðan: 22,7% nákvæmni við nafnagreiningu.

Þessi tala er áhrifamikil. Af 100 flaggaðum liðum eru 23 raunveruleg einstaklingsnöfn. Hin 77 eru falskt jákvæðar — vörumerki, hlutabréfatákn eða borgarheiti.

Þrjár af hverjum fjórum greiningum eru rangar. Þetta er ekki minniháttar kvörðunarvandi. Þetta er bilað verkfæri fyrir vinnslu viðskiptaskjala.

Af hverju þetta gerist

Presidio notar en_core_web_lg líkan spaCy að sjálfgefnu. Þetta líkan lærði af fréttatexta. Í fréttum eru flestar sérheiti raunveruleg mannanöfn eða staðarheiti.

Viðskiptaskjöl eru önnur saga.

Vörumerki sem líkjast persónunöfnum. "Apple iPhone 15 Pro sendingarskráningar" er flaggað sem PERSON. Sama gildir um "Samsung Galaxy Tab" og "Cisco Meraki uppsetning."

Fyrirtækjaheiti með nafnlíkum hlutum. Í "Johnson Controls niðurstöður" er orðið "Johnson" flaggað sem PERSON. "Goldman Sachs safn" kveikir sömu villu.

Staðarheiti sem kveikja nafnagreiningu. "Victoria Harbour verkefni" flaggar "Victoria" sem PERSON. "Santiago miðstöð" flaggar "Santiago" á sama hátt.

Líkanið skortir samhengi til að greina "Apple" (fyrirtæki) frá "Apple Smith" (manneskja). Sá munur er rót flestra falskt jákvæðra niðurstaðna. Fréttatexti kenndi því að meðhöndla sérheiti sem fólk eða staði. Viðskiptatexti brýtur þá reglu stöðugt.

Niðurstreymisáhrifin

Gagnafyrirtæki notaði Presidio til að hreinsa viðskiptavinakannanir áður en þær voru deildar. Endurskoðun fann fjögur vandamál. Í fyrsta lagi höfðu 40% kannana vörumerki ranglega fjarlægt. Í öðru lagi voru borgarheiti þurrkaðar út úr öllum svörum. Í þriðja lagi voru vörumerki þurrkuð úr greiningarsafninu. Í fjórða lagi var ekki hægt að lesa upplifunargreiningu um sérstakar vörur.

Greiningateymið fékk ritskoðaðan texta þar sem allar vísanir í vörur voru fjarlægðar. Kannanin hafði upphaflega nefnt iPhone Pro og Apple hleðslutæki. Sú merking var horfin.

Fyrirtækið var ekki að vernda friðhelgi betur. Það var að brjóta gögn án þess að öðlast reglufylgni. Presidio var skipt út eftir endurskoðunina.

Sjá reglufylgniyfirlit okkar til að skilja hvernig greiningar gæði hefur áhrif á lagalegar skyldur þínar.

Betri nálgun: Blendingsgreining

Vandinn er ekki einstakur fyrir Presidio. NER á táknarstigi án samhengis mun alltaf hafa þetta vandamál. Lausnin er samhengismeðvæt greining.

Af hverju umbreytingarlíkön hjálpa: Líkan eins og XLM-RoBERTa les heila setninguna. "Apple tilkynnti hagnað sinn" → Apple er fyrirtæki. "Apple Smith gekk til liðs við teymið" → Apple er fornafn. Samhengið segir þér hvort er hvað.

Þetta bætir nákvæmni á meðan hlutfall endurheimtu helst hátt. Sjá samanburðinn hér að neðan.

NálgunNákvæmniEndurheimta
Presidio sjálfgefin NER22,7%~85%
Aðeins regex~95%~40%
Blendings (Regex + NLP + Umbreyting)~85%~80%

Blendingsnálgunin nær 85% nákvæmni. Það þýðir 15% falskt jákvæð hlutfall. Mun betra en 77,3%. Fyrir viðskiptaskjöl skiptir þessi munur máli.

Blendingsstaflan hefur fjögur skref:

  1. Regex-lag: Finnur skipulagðar auðkennir — tölvupóstar, símanúmer, SSN, IBAN. Snið eru föst, svo falskt jákvæðar eru sjaldgæfar. Þetta keyrir fyrst.

  2. NLP-lag (spaCy): Venjuleg NER fyrir fólk, fyrirtæki og staði. Há endurheimta, lægri nákvæmni.

  3. Umbreytingarlag (XLM-RoBERTa): Endurmetur hverja NLP-niðurstöðu með fullum setningarsamhengi. "Apple" í vörumerkjasamhengi missir einingastig sitt. "Jón" í kvörtunarsamhengi hlýtur það.

  4. Áreiðanleikaþröskuldur: Aðeins niðurstöður yfir ákveðnu stigi ná til úttaksins. Hækkaðu þröskuldinn fyrir greiningartilvik. Lækkaðu hann fyrir HIPAA-nafnleysi.

Niðurstöður eftir skipti

Greiningafyrirtækið skiptaði yfir í blendingsgreiningu. Ávinningurinn var skýr. Falskt jákvæðar á vörumerkjum féllu frá 40% í 3%. Falskt jákvæðar á borgarheitum féllu næstum í núll. Raunveruleg nafnaendurheimta stóð í ~82%, lítið eitt niður frá 85%, en nákvæmni batnaði mikið.

Kannanir urðu nothæfar aftur. "iPhone", "Apple", "Samsung" og "Chicago" héldu sér í textanum. Rétt nöfn viðskiptavina í kvörtunarsamhengi voru rétt fjarlægð.

Blendingsgreining krefst meiri útreikninga. Fyrir stór verk eru keyrslutímar nokkuð lengri. Fyrir flestar viðskiptalegar notkunartegundir er nákvæmnivinningurinn þess virði. Fyrirtækið gat keyrt greininguna aftur. Þetta var tilgangur kannanagagnanna.

Lestu um greiningaraðferð okkar í öryggisyfirlitinu.

Þegar hátt falskt jákvætt hlutfall er ásættanlegt

Sumar aðstæður forgangsraða endurheimtu fram yfir nákvæmni.

HIPAA Safe Harbor: Að missa raunverulegt jákvætt er brot. 10% falskt jákvæð hlutfall er fínt ef raunverulegt PHI er aldrei misst. Offjarlæging er öruggari en vanfjarlæging.

Lögfræðileg endurskoðun: Að missa forréttindaðila getur fellt niður forréttindi. Falskt jákvæðar þarfnast endurskoðunar en skapar ekki ábyrgð.

Viðskiptagreining: Offjarlæging brýtur gögn án reglufylgniávinnings. Nákvæmni skiptir meira máli hér. Notaðu blendingsnálgun með háan áreiðanleikaþröskuldur. Þetta heldur vörumerkjum og borgarheitum í úttakinu. Aðeins raunveruleg persónunöfn eru fjarlægð.

Rétt jafnvægi fer eftir notkunartilvikinu þínu. Verkfæri sem leyfa þér að stilla þröskuldinn gefa þér stjórnina. Engin ein sjálfgefin stilling virkar fyrir allt samhengi.

Sjá FAQ okkar fyrir algengar spurningar um þröskulda og greiningarham.

Niðurstaða

22,7% nákvæmnihlutfall þýðir að 3 af hverjum 4 greiningum eru rangar. Fyrir viðskiptaskjöl gerir það úttak ónothæft fyrir greiningu. Það gefur einnig ranga öryggisvísur um reglufylgni.

Blendingsgreining lagar þetta. Hún sameinar regex, NLP og umbreytingarskorun. Gögn haldast gagnleg eftir nafnleysi. Raunveruleg persónunöfn eru fjarlægð. Vörumerki, borgarheiti og vöruauðkenni haldast.

Ef þú fórst frá Presidio vegna vandamála með falskt jákvæðar, er þetta leiðin áfram. Ekki ný uppsetning á sama líkani. Önnur byggingarfræði smíðuð fyrir viðskiptaskjalasamhengi.

Heimildir

Priva PII Benchmark 2024: Nákvæmnimat Presidio. STAÐFEST-UTANAÐKOMANDI.

Microsoft Presidio: Studdar einingar og líkanabyggingarfræði. STAÐFEST-UTANAÐKOMANDI.

spaCy: en_core_web_lg þjálfunargögn og takmarkanir. STAÐFEST-UTANAÐKOMANDI.

Ertu tilbúinn að vernda gögnin þín?

Byrjaðu að anonymiza PII með 285+ gerðum í 48 tungumálum.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.