Tornar al BlogTècnic

El problema de precisió del 22.7% de Presidio...

Una comparativa de 2024 va trobar que el reconeixidor de nom de persona de Presidio aconsegueix una precisió del 22.7% en documents comercials...

April 21, 20267 min llegit
Presidio precisionfalse positivesNER accuracyPII detection qualityhybrid recognizer

El problema de precisió del 22.7% de Presidio: Per què els falsos positius estan destruint els teus resultats d'anonimització

Els falsos positius en detecció de PII no són una molèstia menor. Quan el 77.3% del que la teva eina assenyala com a «noms de persona» no són noms de persona, no estàs protegint la privacitat — estàs destruint les dades.

Una comparativa de 2024 va descobrir que Microsoft Presidio (l'eina de detecció de codi obert més popular) aconsegueix aquests resultats de precisió en documents empresarials reals.

La comparativa

Els investigadors van executar Presidio contra 500 documents comercials reals: contractes de proveïdors, correus electrònics interns, registres de vendes, formularis de recursos humans. El focus: la capacitat del reconeixidor de nom de persona de Presidio.

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.