By · Last updated 2026-03-23

Itzuli BlogeraTeknikoa

Positibo Faltsuak: ML Berredakzioak Zergatik Huts Egiten Duen

2024ko benchmark batek aurkitu zuen Presidio-k 4.434 laginen artean 13.536 positibo faltsu izen-detekzio sortu zituela - izenordainak, ontzi-izenak eta herrialdeak pertsona-izen gisa markatzen. Hemen dago hori lege eta osasun inguruneetan zer kostatzen duen.

March 23, 20268 min irakurri
Presidio false positive ratePII detection precisionautomated redaction costlegal document reviewhybrid PII detection

2026rako eguneratua

%22,7ko Zehaztasun Arazoa

2024ko ikerketa batek Microsoft Presidio enpresa-fitxategietan probatu zuen. Presidio PII iturri irekiko tresna bat da. Lege-taldeek eta osasun-taldeak zabalki erabiltzen dute.

Ikerketak neurtu zuen Presidio zenbat aldiz zen zuzena. Pertsona-izen gisa markatu zituen elementu guztietatik, zenbat ziren benetako pertsona-izenak?

Erantzuna %22,7 zen. Markatutako 100 elementutik 77 inguru oker zeuden. Ikerketa 4.434 lagin-fitxategitan 13.536 marka faltsu zenbatu zituen.

Akatsak ez ziren ausazkoak. Eredu argiak jarraitzen zituzten:

  • Izenordainak pertsona gisa markatuta ("Ni" esaldi hasieran)
  • Ontzi-etiketak pertsona gisa markatuta ("ASL Scorpio")
  • Enpresa-etiketak pertsona gisa markatuta ("Deloitte & Touche")
  • Herrialde-terminoak pertsona gisa markatuta ("Argentina", "Singapore")

Hauetako bat ere ez da ertz-kasu arraroa. Agertzen dira NLP modelo orokor bat domeinu-espezifiko testua aurkitzen duen bakoitzean. Modeloa ez zen haiek bereizteko eraikita.

Marka Faltsuek Zer Kostatzen Duten

Lege eta osasun lanetan, marka bakoitzak erantzuna behar du. Taldeek hiru aukera dituzte. Hiru guztiek kostu errealak dituzte.

1. Aukera: Gizakiak marka guztiak egiaztatu. Abokatu eta aditu denborak 200 eta 800 euro artean kostatzen du orduko. %22,7ko zehaztasunarekin, bolumena izugarria da. Eskalan ez da bideragarria. Ikus eDiscovery PII Automatizazioa eta Lege Berrikuspena Kostu Murrizketa berrikuspena kostuak bolumenarekin nola hazten diren ikusteko.

2. Aukera: Berrikuspena saihestu eta irteera fidatu. Hori ere arriskutsua da. "Berredaktatutako" elementuen %77 sentikorra ez denean, arrisku legala sortzen duzu. Auzitegiek abokatuei isuna jarri diete gehiegizko berredazketa dela eta. Ikus eDiscovery Gehiegizko Berredakzio Zigorrak dokumentatutako kasu ikusteko.

3. Aukera: Puntuaketa atala igotzea. Presidio-k erabiltzaileei score_threshold ezartzeko aukera ematen die marka ahulak kentzeko. 2024ko DICOM ikerketa batek hori 0,7n probatu zuen - barra nahiko altua. Emaitza: 39 DICOM irudietatik 38tan marka faltsuak zeuden. Atalaseak laguntzen dute. Ez dute erro-kausa konpontzen.

Zergatik NLP Orokorrak Hemen Arazoak Ditu

Presidio-ren hutsunea trebaketako datuak eta benetako erabileraren arteko desadostasun batetik dator.

Lege-fitxategiak letra larriz idatzitako termino askoz beteta daude. Kasu-izenak, lege-tituluak eta erakusketa-kodeak datu pertsonalak dirudite modelo orokor baten aurrean. Markatzen ditu. Gehienak ez dira datu pertsonalak.

Osasun-fitxategiek sendagaien izenak, gailuen kodeak eta laburtzapen kliniko laburrak gehitzen dituzte. "Pt." Pazientea esan nahi du. "Dr." Medikua esan nahi du. Hauek entitate-detekzioa nahasten dute aurreikusten zaila den modutan.

Finantza-fitxategiek produktu-kodeak, entitate-kateak eta kontu-IDak dituzte datu pertsonalekin azalera-ereduak partekatzen dituztenak.

Modelo bat domeinu-datuetan hobetzea laguntzen du. Baina eraikitzea eta eguneratuta mantentzea denbora eta esfortzua eskatzen du.

Detekzio Hibridoak Nola Konpontzen Duen Hau

Marka faltsuaren arazoa konponbide argia du. Lan mota arabera banatu.

Datu egituraturako patroi-arauak. Gizarte segurantza-zenbakiak, telefono-zenbakiak, helbide elektronikoak eta ID formatuak arau finkoak jarraitzen dituzte. Kate batek eredua bete eta egiaztapen-digitu proba gaindituko du, edo ez du. Zero marka faltsu arau-multzo baliozkoentzat.

Hizkuntza-modeloak testu libre. Lehen eta azken izenak, enpresa-etiketak eta prosako kokapenak egitura zurrunik ez dute. NLPak aurkitzen ditu arauek ezin dituztenean. Konfiantza-puntuaketek eta testuinguru-egiaztapenek marka faltsuaren tasa murrizten dute.

Mota bakoitzeko puntuaketa-ezarpenak kontrol finerako. Gehiegizko berredakzio-arriskua hartu ezin duten lege-taldeek atalase altuak ezartzen dituzte bat-etorze lausoentzat. Aipamen altua behar duten ikerketa-taldeek baxuagoak ezartzen dituzte. Ikus Bitar PII Detekzioa eta Konfiantza-Puntuaketa Betebeharrerako puntuaketa-mailek praktikan nola funtzionatzen duten.

Emaitza Presidio lehenetsitakoak baino akats askoz gutxiago da. Aipamena indartsu geratzen da arauek bakarrik gehiegi galduko luketen tokian.

Lege eta osasun-taldeentzat, gako-galdera ez da marka faltsuak existitzen ote diren. NLP sistemetan beti existitzen dira. Galdera da tresnak konpromisoa ezartzeko, neurtzeko eta dokumentatzeko aukera ematen dien.

Iturriak

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.