Vals Positiewes: Waarom ML-Redigering Misluk

'n 2024-maatstaf het gevind dat Presidio 13 536 vals positiewe naamsopsporings oor 4 434 monsters gegenereer het -- wat voornaamwoorde, skeepname en lande as persone gemerk het.

George CurtaMarch 23, 20268 min lees

Presidio false positive ratePII detection precisionautomated redaction costlegal document reviewhybrid PII detection

Opgedateer vir 2026

Die 22.7%-Presisieprobleem

'n 2024-studie het Microsoft Presidio op sakeers getoets. Presidio is 'n oopbron-PII-hulpmiddel. Regspanne en gesondheidsgroepe gebruik dit wyd.

Die studie het gemeet hoe dikwels Presidio korrek was. Van al die items wat dit as persoonname gemerk het, hoeveel was werklik persoonname?

Die antwoord was 22.7%. Ongeveer 77 uit elke 100 merke was verkeerd. Die studie het 13 536 vals merke oor 4 434 voorbeeldleers getel.

Die foute was nie toevallig nie. Hulle het duidelike patrone gevolg:

Voornaamwoorde gemerk as mense ("I" aan die begin van 'n sin)
Skeeplabels gemerk as mense ("ASL Scorpio")
Maatskappylabels gemerk as mense ("Deloitte & Touche")
Landterme gemerk as mense ("Argentina," "Singapore")

Geeen van hierdie is seldsame randgevalle nie. Hulle verskyn wanneer 'n algemene NLP-model domein-spesifieke teks teekom. Die model is nie gebou om hulle te onderskei nie.

Wat Vals Merke Kos

In regs- en gesondheidswerk benodig elke merk 'n reaksie. Spanne het drie opsies. Al drie het werklike kostes.

Opsie 1: 'n Mens kontroleer elke merk. Prokureur- en kundige-tyd loop van $200 tot $800 per uur. By 22.7% akkuraatheid is die volume groot. Dit is nie lewensvatbaar op skaal nie. Sien eDiscovery PII-Outomatisering en Regshersiening-Kostebesnoeiing vir hoe hersiening-kostes met volume groei.

Opsie 2: Slaan hersiening oor en vertrou die uitvoer. Dit is ook riskant. Wanneer 77% van "geredigeerde" items nie sensitief is nie, skep u regsrisiko. Howe het prokureurs beboet vir oor-redigering. Sien eDiscovery Oor-Redigering-Sanksies vir gedokumenteerde gevalle.

Opsie 3: Verhoog die tellingdrempel. Presidio laat gebruikers toe om 'n `score_threshold` in te stel om swak merke te verwyder. 'n 2024 DICOM-studie het dit by 0.7 getoets -- 'n redelik hoe maatstaf. Die resultaat: 38 uit 39 DICOM-beelde het steeds vals merke gehad. Drempels help. Hulle los nie die worteloorsaak op nie.

Waarom Algemene NLP Hier Sukkel

Die Presidio-gaping kom van 'n wanpassing tussen opleidingsdata en werklike gebruik.

Regsleers is vol hoofletterterme. Saakname, wettitels en uitstel-kodes lyk almal soos persoonlike data vir 'n algemene model. Dit merk hulle. Die meeste is nie persoonlike data nie.

Gesondheidsleers voeg geneesmiddelname, toestelkodes en kliniese kortvorms by. "Pt." beteken Patient. "Dr." beteken Dokter. Hierdie struikel entiteitsopsporing op maniere wat moeilik is om te voorspel.

Finansiële leers het produk-kodes, entiteitsstringe en rekening-ID's wat oppervlakpatrone deel met persoonlike rekords.

Fyn-instelling van 'n model op domeindata help. Maar dit neem tyd en moeite om te bou en op datum te hou.

Hoe Hibriede Opsporing Dit Regmaak

Die valsmerk-probleem het 'n duidelike oplossing. Verdeel die werk per datatipe.

Patroonreels vir gestruktureerde data. Sosiale sekuriteitsnommers, telefoonnommers, e-posadresse en ID-formate volg vaste reels. 'n String pas die patroon en slaag 'n kontrolesyfer-toets, of nie. Nul vals merke vir geldige reelstelle.

Taalmodelle vir vry teks. Eerste en laaste name, maatskappylabels en liggings in prosa het nie vaste struktuur nie. NLP vind hulle wanneer reels nie kan nie. Vertrouenstellings en kontekskontrolles sny die valsmerk-koers.

Per-tipe tellinginstellings vir fyn beheer. Regspanne wat oor-redigering nie kan bekostig nie, stel hoe drempels vir fussy-passing in. Navorsingsgrepe wat hoe herroeping benodig, stel laer drempels. Sien Binere PII-Opsporing en Vertrouensgradering vir Nakoming vir hoe tellingvlakke in die praktyk werk.

Die resultaat is baie minder foute as Presidio-verstelwaardes. Herroeping bly sterk waar reels alleen te veel sou mis.

Vir regs- en gesondheidspanne is die sleutelvraag nie of vals merke bestaan nie. Dit bestaan altyd in NLP-stelsels. Die vraag is of die hulpmiddel u toelaat om die kompromis in te stel, te meet en te dokumenteer.

Bronne

Verwante Artikels

Tegnies

Gereed om u data te beskerm?

Begin om PII te anonimiseer met 285+ entiteitstipes in 48 tale.

Begin Gratis Proeflopie Besoek Kenmerke

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

We follow these rules

GDPR (EU 2016/679).
ISO/IEC 27001:2022.
NIS2 (EU 2022/2555).
HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our company HQ is in Saarbrücken, Germany. Our servers run in Hetzner's Falkenstein datacenter.

Hetzner holds ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

We never sell your information to third parties.
We never train models on what you upload.
We never keep your work after you delete it.
We never share keys with any outside firm.
We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.

Vals Positiewes: Waarom ML-Redigering Misluk

Die 22.7%-Presisieprobleem

Wat Vals Merke Kos

Waarom Algemene NLP Hier Sukkel

Hoe Hibriede Opsporing Dit Regmaak

Bronne

Verwante Artikels

Presidio: 3-Week Setup vs Managed PII

6 Weeks to 3 Days: Managed PII Setup

Free PII Detection Costs €13K/Year

Gereed om u data te beskerm?

Vals Positiewes: Waarom ML-Redigering Misluk

Die 22.7%-Presisieprobleem

Wat Vals Merke Kos

Waarom Algemene NLP Hier Sukkel

Hoe Hibriede Opsporing Dit Regmaak

Bronne

Verwante Artikels

Presidio: 3-Week Setup vs Managed PII

6 Weeks to 3 Days: Managed PII Setup

Free PII Detection Costs €13K/Year

Gereed om u data te beskerm?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow