The 90% False Positive Benchmark
Technologickej analýzy Forrester a McKinsey z roku 2025 naznačujú nepostihnutú epidémiu falošných pozitívov pri detektovaní PII. V prieskume 1,200 podnikov EÚ:
- 87% hlásilo > 20% falošných pozitívov pri spracovaní Excel tabuliek
- 76% hlásilo > 30% falošných pozitívov pri e-mailoch
- 62% bolo nútených vypnúť detekciu, pretože "všetko sa vždy blokovalo"
Falošný pozitív znamená, že legitimný obchodný údaj — názov produktu, identifikátor projektu, kód oddelenia — sa označí ako citlivý a blokuje sa. Na sklade to má tri náklady:
-
Náklady na obnovu: Každý falošný pozitív vyžaduje manuálny zásah. Spravidla sa robí 5-10 minútové recenziay. Škála: 1,000 dokumentov × 1% falošných pozitívov × 7 minút = 70 hodín mesačne na jedného analytika EÚ.
-
Náklady na opomenutia (False Negatives): Ak znížite senzitivitu detekcie, aby ste redukovali falošné pozitívy, zvýšite skutočné prípady úniku. Nevyhnutný obchodný kompromis.
-
Náklady na operácie: Organizácie sa uchyľujú k "ručnému režimu" — ľudí namiesto nástrojov — pretože nástroje sú nepoužiteľné.
Presnosť vs. Recall vs. F1
Falošný pozitív je dôsledok slabej presnosti — z celkového počtu flajov detekcií, koľko sú skutočne pozitívne:
Presnosť = TP / (TP + FP) = skutočné pozitívy / (skutočné pozitívy + falošné pozitívy)
Napríklad:
- Nástroj A: 1,000 detektov, 850 sú opravdu PII (presnosť 85%). 150 falošných pozitívov.
- Nástroj B: 500 detektov, 490 sú opravdu PII (presnosť 98%). 10 falošných pozitívov.
Napriek tomu, že Nástroj A oznámení viac detektov (1,000 vs 500), Nástroj B je operačne lepší — nižšia daň na vrátenie.
F1 skóre (harmonický priemer presnosti a recall) je metriku, ktorá má zmysel:
F1 = 2 × (Presnosť × Recall) / (Presnosť + Recall)
Napriek tomu, že maximalizácia F1 je ideálna, väčšina podnikov optimalizuje podľa Presnosť — minimalizácia falošných pozitívov — pretože operačná daň je vyšší ako chýbajúce detekcie.