Späť na blogTechnické

Daň na falošný pozitív: Prečo má váš nástroj PII...

90% podnikov hlási > 30% falošné pozitívy pri detektovaní PII — falošne pozitívne značí legitimné obchodné údaje ako citlivé.

April 3, 20268 min čítania
false positive ratePresidio precisionPII detection accuracyscore threshold configurationhybrid detection

The 90% False Positive Benchmark

Technologickej analýzy Forrester a McKinsey z roku 2025 naznačujú nepostihnutú epidémiu falošných pozitívov pri detektovaní PII. V prieskume 1,200 podnikov EÚ:

  • 87% hlásilo > 20% falošných pozitívov pri spracovaní Excel tabuliek
  • 76% hlásilo > 30% falošných pozitívov pri e-mailoch
  • 62% bolo nútených vypnúť detekciu, pretože "všetko sa vždy blokovalo"

Falošný pozitív znamená, že legitimný obchodný údaj — názov produktu, identifikátor projektu, kód oddelenia — sa označí ako citlivý a blokuje sa. Na sklade to má tri náklady:

  1. Náklady na obnovu: Každý falošný pozitív vyžaduje manuálny zásah. Spravidla sa robí 5-10 minútové recenziay. Škála: 1,000 dokumentov × 1% falošných pozitívov × 7 minút = 70 hodín mesačne na jedného analytika EÚ.

  2. Náklady na opomenutia (False Negatives): Ak znížite senzitivitu detekcie, aby ste redukovali falošné pozitívy, zvýšite skutočné prípady úniku. Nevyhnutný obchodný kompromis.

  3. Náklady na operácie: Organizácie sa uchyľujú k "ručnému režimu" — ľudí namiesto nástrojov — pretože nástroje sú nepoužiteľné.

Presnosť vs. Recall vs. F1

Falošný pozitív je dôsledok slabej presnosti — z celkového počtu flajov detekcií, koľko sú skutočne pozitívne:

Presnosť = TP / (TP + FP) = skutočné pozitívy / (skutočné pozitívy + falošné pozitívy)

Napríklad:

  • Nástroj A: 1,000 detektov, 850 sú opravdu PII (presnosť 85%). 150 falošných pozitívov.
  • Nástroj B: 500 detektov, 490 sú opravdu PII (presnosť 98%). 10 falošných pozitívov.

Napriek tomu, že Nástroj A oznámení viac detektov (1,000 vs 500), Nástroj B je operačne lepší — nižšia daň na vrátenie.

F1 skóre (harmonický priemer presnosti a recall) je metriku, ktorá má zmysel:

F1 = 2 × (Presnosť × Recall) / (Presnosť + Recall)

Napriek tomu, že maximalizácia F1 je ideálna, väčšina podnikov optimalizuje podľa Presnosť — minimalizácia falošných pozitívov — pretože operačná daň je vyšší ako chýbajúce detekcie.

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.