anonym.legal
Назад до блогуТехнічні

Податок на хибнопозитивні результати...

GitHub issue Presidio #1071 документує систематичні хибнопозитивні результати.

April 3, 20268 хв читання
false positive ratePresidio precisionPII detection accuracyscore threshold configurationhybrid detection

Невидимий податок

«Ми автоматизували наш процес редагування PII — він займає частку часу.»

Але скільки часу витрачається на огляд хибнопозитивних виявлень?

Податок на хибнопозитивні результати: час, витрачений на перегляд, підтвердження та усунення неправильних виявлень PII.

Математика у масштабі

При 22,7% точності (Presidio benchmark):

Корпоративний сценарій: 10 000 документів/місяць

  • Середньо 20 виявлень на документ = 200 000 виявлень
  • 77,3% хибнопозитивних = 154 600 неправильних виявлень
  • 30 секунд огляду кожного = 1 288 годин огляду
  • При €50/годину = €64 400/місяць у прихованих витратах

Це в 179 разів більше вартості підписки Business anonym.legal на рік.

Рішення: точність проти хибнопозитивних результатів

anonym.legal гібридне виявлення забезпечує:

  • ML NER для іменованих сутностей (висока повнота)
  • Детерміністичні правила з контрольними сумами (висока точність)
  • Контекстна усвідомленість зменшує хибнопозитивні результати
  • Списки виключень для загальних хибнопозитивних (назви продуктів, країни в контексті)

Цільова точність: >85% (порівняно з 22,7% в Presidio для ділових документів).


Джерела:

Готові захистити свої дані?

Почніть анонімізувати PII з 285+ типами сутностей на 48 мовах.