By · Last updated 2026-03-23

Bumalik sa BlogTeknikal

Mga False Positive: Bakit Nabibigo ang ML Redaction

Natuklasan ng isang 2024 benchmark na ang Presidio ay gumawa ng 13,536 false positive na pag-detect ng pangalan sa 4,434 sample - na ni-flag ang mga pronoun, pangalan ng barko, at mga bansa bilang mga pangalan ng tao. Narito ang halaga nito sa mga legal at healthcare na kapaligiran.

March 23, 20268 min basahin
Presidio false positive ratePII detection precisionautomated redaction costlegal document reviewhybrid PII detection

Ina-update para sa 2026

Ang 22.7% na Problema sa Precision

Isang pag-aaral noong 2024 ang sumubok sa Microsoft Presidio sa mga business file. Ang Presidio ay isang open-source na tool sa PII. Malawak itong ginagamit ng mga legal team at health group.

Sinukat ng pag-aaral kung gaano kadalas tama ang Presidio. Sa lahat ng item na ni-flag nito bilang mga pangalan ng tao, ilan ang talagang mga pangalan ng tao?

Ang sagot ay 22.7%. Tungkol sa 77 sa bawat 100 flag ang mali. Binilang ng pag-aaral ang 13,536 na maling flag sa 4,434 na sample na file.

Ang mga pagkakamali ay hindi random. Sumunod sila sa malinaw na mga pattern:

  • Mga pronoun na na-flag bilang tao ("I" sa simula ng pangungusap)
  • Mga label ng barko na na-flag bilang tao ("ASL Scorpio")
  • Mga label ng kumpanya na na-flag bilang tao ("Deloitte & Touche")
  • Mga terminong bansa na na-flag bilang tao ("Argentina," "Singapore")

Wala sa mga ito ang bihirang edge case. Lumalabas ang mga ito kapag nakaharap ang isang pangkalahatang NLP model sa domain-specific na teksto. Hindi itinayo ang model para makilala ang pagkakaiba ng mga ito.

Ano ang Nagastos ng Mga Maling Flag

Sa legal at health na trabaho, ang bawat flag ay nangangailangan ng tugon. Nahaharap ang mga team sa tatlong pagpipilian. Ang lahat ng tatlo ay may tunay na gastos.

Pagpipilian 1: Susuriin ng tao ang bawat flag. Ang oras ng abogado at eksperto ay nagtatakbo ng $200 hanggang $800 bawat oras. Sa 22.7% na katumpakan, malaki ang dami. Hindi ito magagawa sa malaking sukat. Tingnan ang eDiscovery PII Automation and Legal Review Cost Reduction para sa kung paano lumalaki ang mga gastos sa review sa volume.

Pagpipilian 2: Laktawan ang review at pagkatiwalaan ang output. Peligroso rin ito. Kapag 77% ng mga "na-redact" na item ay hindi sensitibo, lumilikha kang legal na panganib. Pinarusahan ng mga korte ang mga abogado para sa over-redaction. Tingnan ang eDiscovery Over-Redaction Sanctions para sa mga dokumentadong kaso.

Pagpipilian 3: Itaas ang score threshold. Pinapayagan ng Presidio ang mga gumagamit na magtakda ng score_threshold para ibaba ang mga mahinang flag. Isang pag-aaral ng DICOM noong 2024 ang sumubok nito sa 0.7 - isang medyo mataas na bar. Ang resulta: 38 sa 39 na DICOM image ay mayroon pa ring mga maling flag. Nakatutulong ang mga threshold. Hindi nila inaayos ang ugat na sanhi.

Bakit Nahihirapan Dito ang Pangkalahatang NLP

Ang agwat ng Presidio ay nagmumula sa hindi pagtutugma sa pagitan ng data ng pagsasanay at tunay na paggamit.

Puno ng mga capital-letter na termino ang mga legal na file. Ang mga pangalan ng kaso, mga titulo ng batas, at mga code ng eksibisyon ay lahat ay mukhang personal na data para sa isang pangkalahatang modelo. Ni-ni-flag sila. Karamihan ay hindi personal na data.

Nagdaragdag ang mga file ng kalusugan ng mga pangalan ng gamot, mga code ng device, at mga klinikal na short form. Ang "Pt." ay nangangahulugang Pasyente. Ang "Dr." ay nangangahulugang Doktor. Ang mga ito ay nagdudulot ng entity detection sa mga paraan na mahirap hulaan.

Ang mga file sa finance ay may mga code ng produkto, mga string ng entity, at mga account ID na nagbabahagi ng mga pattern ng ibabaw sa mga personal na rekord.

Ang fine-tuning ng isang modelo sa data ng domain ay nakakatulong. Ngunit nangangailangan ito ng oras at pagsisikap para buuin at panatilihing napapanahon.

Paano Inaayos ng Hybrid Detection Ito

Ang problema ng maling flag ay may malinaw na solusyon. Hatiin ang trabaho ayon sa uri ng data.

Mga panuntunan ng pattern para sa nakastrukturang data. Ang mga social security number, numero ng telepono, email address, at mga format ng ID ay sumusunod sa mga naayos na panuntunan. Ang isang string ay alinman ay umaangkop sa pattern at pumapasa sa isang check digit test, o hindi. Zero na maling flag para sa mga valid na rule set.

Mga modelo ng wika para sa libreng teksto. Ang mga first at last name, mga label ng kumpanya, at mga lokasyon sa prosa ay kulang sa mahigpit na istruktura. Hinahanap sila ng NLP kapag hindi kaya ng mga panuntunan. Ang mga confidence score at mga tseke ng konteksto ay nagpapababa ng rate ng maling flag.

Mga setting ng score bawat uri para sa pinong kontrol. Ang mga legal team na hindi maaaring magsugal ng over-redaction ay nagtatakda ng mataas na threshold para sa mga fuzzy match. Ang mga research team na nangangailangan ng mataas na recall ay nagtatakda ng mas mababa. Tingnan ang Binary PII Detection and Confidence Scoring for Compliance para sa kung paano gumagana ang mga tier ng score sa praktika.

Ang resulta ay mas kaunting pagkakamali kaysa sa mga default ng Presidio. Nananatiling malakas ang recall kung saan ang mga panuntunan lamang ay mapalampas ng masyadong marami.

Para sa mga legal at health team, ang pangunahing tanong ay hindi kung umiiral ang mga maling flag. Palagi silang nasa mga sistema ng NLP. Ang tanong ay kung nagbibigay-daan ba ang tool sa inyo na itakda, sukatin, at idokumento ang tradeoff.

Mga Pinagkukunan

Handa nang protektahan ang iyong data?

Simulan ang anonymization ng PII gamit ang 285+ uri ng entidad sa 48 wika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.