By · Last updated 2026-06-05

Tagasi BlogisseTehniline

Presidio 22,7% täpsusprobleemi

2024. aasta vordlustestis saavutas Presidio isiku nimetuvastaja 22,7% täpsuse äridokumentides - see tahendab, et 77,3% tuvastustest on valepositive'id.

June 5, 20267 min lugemist
Presidio precisionfalse positivesNER accuracyPII detection qualityhybrid recognizer

Presidio 22,7% täpsusprobleem

Valepositive'id PII tuvastamisel tekitavad tõelist kahju. Kui 77,3% sellest, mida teie tööriist märgistab "isiku nimedeks", ei ole tegelikud nimed, ei kaitse te privaatsust. Te hävitate andmeid.

  1. aasta vordlustestis testiti Microsoft Presidio vaikimisi NER-mudelit äridokumentidel. Test hõlmas finantsaruandeid, kliendkirju, tootedokumente ja tugipilette. Tulemus: 22,7% täpsus nimetuvastuses.

See arv on rabav. Iga 100 märgistatud elemendi kohta on 23 tegelikud individuaalsed nimed. Ülejäänud 77 on valepositive'id - toote sildid, kaubamärgi terminid või linna sildid.

Kolm neljast tuvastusest on valed. See ei ole väike kalibreeringuprobleem. See on katki tööriist äridokumentide töös.

Miks see juhtub

Presidio kasutab vaikimisi spaCy en_core_web_lg mudelit. See mudel õppis uudistekstist. Uudistes on enamik pärisnimesid tegelikud inimesed või kohad.

Äridokumendid on erinevad.

Toote sildid, mis näevad välja nagu individuaalsed nimed. "Apple iPhone 15 Pro saadetise rekordid" märgistatakse kui PERSON. Sama juhtub "Samsung Galaxy Tab" ja "Cisco Meraki juurutusega".

Ettevõtte terminid nimesarnaste osadega. "Johnson Controls tulemustes" märgistatakse sõna "Johnson" kui PERSON. "Goldman Sachsi portfell" käivitab sama vea.

Asukoha sildid, mis käivitavad isiku tuvastamise. "Victoria sadama projekt" märgistab "Victoria" PERSON-ina. "Santiago keskus" märgistab "Santiago" samamoodi.

Mudel ei suuda eristada "Apple" (ettevõte) ja "Apple Smith" (isik). See lõhe on enamiku valepositive'ide juur. Uudistekst õpetas seda kohtlema pärisnimesid inimeste või kohtadena. Äriteksтis rikutakse seda reeglit kogu aeg.

Allavoolu efekt

Üks andmefirma kasutas Presidiot kliendiküsitluste puhastamiseks enne nende jagamist. Audit leidis neli probleemi. Esiteks eemaldati 40% küsitlustest toote sildid valesti. Teiseks kistuti linna sildid igast vastusest välja. Kolmandaks pühiti kaubamärgi mainingud analüüsikomplektist. Neljandaks ei saanud konkreetsete toodete sentimenti lugeda.

Analüüsimeeskond sai redigeeritud teksti kõikide tooteviidete eemaldamisega. Küsitluses oli algselt mainitud iPhone Pro ja Apple laadijat. See tähendus oli kadunud.

Firma ei kaitsnud privaatsust paremini. See hävitas andmeid ilma vastavust saavutamata. Pärast auditit asendati Presidio.

Vaadake meie vastavuse ülevaadet selle kohta, kuidas tuvastuse kvaliteet mõjutab teie regulatiivset seisundit.

Parem lähenemine: hübriidtuvastus

Probleem ei ole ainulaadne Presidio jaoks. Märgitaseme NER ilma kontekstita omab seda probleemi alati. Lahendus on kontekstiühilduvusega tuvastus.

Miks transformerid aitavad: Mudel nagu XLM-RoBERTa loeb tervet lauset. "Apple teatas oma kasumist" - Apple on ettevõte. "Apple Smith liitus meeskonnaga" - Apple on eesnimi. Kontekst ütleb teile, kumb on kumb.

See parandab täpsust, säilitades kõrge tagasikutsumise. Vaadake allpool olevat võrdlust.

LähenemineTäpsusTagasikutsuminen
Presidio vaikimisi NER22,7%~85%
Ainult regex~95%~40%
Hübriid (Regex + NLP + Transformer)~85%~80%

Hübriidlähenemine saavutab 85% täpsuse. See tähendab 15% valepositive'i määra. Palju parem kui 77,3%. Äridokumentide jaoks on see vahe oluline.

Hübriidpinus on neli sammu:

  1. Regex-kiht: Leiab struktureeritud ID-d - e-posti aadressid, telefoninumbrid, sotsiaalkindlustusnumbrid, IBAN-id. Formaadid on fikseeritud, seega on valepositive'id haruldased. See töötab esimesena.

  2. NLP-kiht (spaCy): Standardne NER inimeste, firmade ja kohtade jaoks. Kõrge tagasikutsumine, madalam täpsus.

  3. Transformerikild (XLM-RoBERTa): Hindab iga NLP tulemuse ümber, kasutades terve lause konteksti. "Apple" toote kontekstis kaotab oma üksuse skoori. "John" kaebuse tekstis saab skoori.

  4. Usaldusläve: Ainult teatud skoorist kõrgemad tabamused lähevad väljundisse. Tõstke lävi analüütika kasutusjuhtudel. Alandage HIPAA de-identifitseerimiseks.

Tulemused pärast üleminekut

Analüütikafirma läks üle hübriidtuvastusele. Kasud olid selged. Toote sildi valepositive'id langesid 40%-lt 3%-le. Linna sildi valepositive'id langesid peaaegu nullini. Tegeliku identiteedi tagasikutsumine jäi ~82%-le, veidi alla 85%, kuid täpsus paranes palju.

Küsitlused said taas kasutatavaks. "iPhone", "Apple", "Samsung" ja "Chicago" jäid teksti. Kliendinimed kaebuste kontekstides eemaldati korrektselt.

Hübriidtuvastus nõuab rohkem arvutust. Suurte tööde jaoks on käitusajad veidi pikemad. Enamiku ärikasutusjuhtudel on täpsuse kasu seda väärt. Firma sai analüüsi uuesti käivitada. See oli küsitlusandmete mõte algusest peale.

Lugege meie tuvastuse lähenemisest turvaülevaates.

Millal kõrge valepositive'i määr on vastuvõetav

Mõnel juhul on tagasikutsumine olulisem kui täpsus.

HIPAA Safe Harbor: Tegeliku positiivse vahele jätmine on rikkumine. 10% valepositive'i määr on fine, kui tegelik PHI ei jää kunagi vahele. Üleeemaldamine on ohutum kui alleemaldamine.

Juriidiline ülevaatus: Privilegeeritud kontakti vahele jätmine võib privileegi loobuda. Valepositive'id vajavad ülevaatust, kuid ei tekita vastutust.

Ärianalüütika: Üleeemaldamine lõhub andmeid ilma vastavuse saavutamiseta. Täpsus on siin olulisem. Kasutage hübriidlähenemist kõrge usalduslävedega. See hoiab kaubamärgi sildid ja linna terminid väljundis. Ainult tegelikud isiku nimed eemaldatakse.

Õige tasakaal sõltub teie kasutusjuhtumist. Tööriistad, mis lasevad teil läve seada, annavad teile kontrolli. Ükski üks vaikimisi seadistus ei tööta igas kontekstis.

Vaadake meie KKK-d tavaliste küsimuste kohta lävede ja tuvastusrežiimide kohta.

Kokkuvote

22,7% täpsuse määr tähendab, et 3 neljast tuvastusest on valed. Äridokumentide jaoks muudab see väljundi analüüsiks kasutuskõlbmatuks. See annab ka vale kindlustunde vastavuse kohta.

Hübriidtuvastus lahendab selle. See ühendab regex, NLP ja transformeri hindamise. Andmed jäävad pärast anonymiseerimist kasutatavaks. Tegelikud isiku nimed eemaldatakse. Kaubamärgi sildid, linna terminid ja toote identifikaatorid jäävad alles.

Kui lahkusite Presidio'st valepositive'i probleemide tõttu, on see edasiminekutee. Mitte sama mudeli uus konfiguratsioon. Erinev arhitektuur, mis on ehitatud äridokumentide kontekstide jaoks.

Allikad

Priva PII Benchmark 2024: Presidio täpsuse hindamine. VERIFIED-EXTERNAL.

Microsoft Presidio: Toetatud üksused ja mudeli arhitektuur. VERIFIED-EXTERNAL.

spaCy: en_core_web_lg koolitusandmed ja piirangud. VERIFIED-EXTERNAL.

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.