Bloga DönTeknik

Yanlış Pozitif Problemi: Neden Saf ML Kırpma Saatte...

2024'te yapılan bir benchmark, Presidio'nun 4,434 örnek üzerinden 13,536 yanlış pozitif isim tespiti gerçekleştirdiğini buldu — zamirleri...

March 23, 20268 dk okuma
Presidio false positive ratePII detection precisionautomated redaction costlegal document reviewhybrid PII detection

Üretimde %22.7 Hassasiyet Problemi

Microsoft Presidio'nun 2024 benchmark çalışması — hukuki teknoloji, sağlık hizmetleri ve kurumsal veri koruma uygulamalarında kullanılan açık kaynaklı PII tespit motoru — iş belgeleri bağlamında kişi adı tespiti için %22.7 hassasiyet oranı buldu.

Hassasiyet, pozitif tanımlamaların doğruluğunu ölçer: aracın "kişi isimleri" olarak işaretlediği öğelerin ne kadarının gerçekten kişi ismi olduğunu gösterir. %22.7'de, yaklaşık her 100 öğeden 77'si yanlış pozitif.

Benchmark, 4,434 belge örneği üzerinden 13,536 yanlış pozitif isim tespiti belgelendi. Yanlış pozitifler şunları içeriyordu:

  • Kişi isimleri olarak işaretlenen zamirler (cümlelerin başında "Ben" gibi)
  • Kişi isimleri olarak işaretlenen gemi isimleri ("ASL Scorpio")
  • Kişi isimleri olarak işaretlenen organizasyon isimleri ("Deloitte & Touche")
  • Kişi isimleri olarak işaretlenen ülke isimleri ("Arjantin," "Singapur")

Bunlar kenar durumlar değildir. Genel amaçlı bir NLP modelinin, karışık veri setleri üzerinde eğitildiğinde, uygun isimlerin belirsizliğini çözmek için eğitilmediği bağlamlarda uygulandığında ortaya çıkan sistematik desenlerdir.

Ölçekli Yanlış Pozitiflerin Maliyet Yapısı

Hukuk ve sağlık hizmetleri ortamlarında, yanlış pozitifler ücretsiz değildir. İşaretlenen her öğe bir işlem gerektirir: ya işareti doğrulamak veya reddetmek için insan incelemesi, ya da yanlış pozitifin düzeltilmeden bırakıldığı otomatik işlem.

Seçenek 1: Her işaretlenen öğenin insan incelemesi. Avukat veya uzman zamanının saatlik maliyeti 200 ila 800 dolar arasında olduğunda, %22.7 hassasiyet sisteminden yanlış pozitifleri incelemek ölçeklendirilmiş olarak ekonomik olarak imkansızdır. %22.7 hassasiyetle her belgede 100 işaretli öğe ile 10,000 belgeli bir üretim için, yaklaşık 77,300 öğe insan incelemesi gerektirir. Her öğe için 5 dakika ve saatte 300 dolar ile, bu 6,442 saat inceleme süresi — yaklaşık 1.9 milyon dolar.

Seçenek 2: Manuel incelemeyi atla ve otomatik işlemi kabul et. Sonuç, "kırpılmış" öğelerin %77'sinin aslında hassas olmadığı bir üretimdir — aşırı kırpma sorumluluğu (gerekçesiz olarak saklanan keşfedilebilir içerik) yaratmakta, belge faydasını yok etmekte ve potansiyel olarak yaptırımları tetiklemektedir.

Seçenek 3: Skor eşikleri. Presidio, yalnızca bir güven eşiğinin üzerindeki öğeleri işaretleyerek yanlış pozitifleri azaltmak için score_threshold yapılandırmasına izin verir. 2024 DICOM tıbbi görüntüleme belgeleri üzerine yapılan bir benchmark çalışması, score_threshold=0.7 ile — nispeten agresif bir hassasiyet filtresi — 39 DICOM görüntüsünden 38'inin hala yanlış pozitif varlıklar içerdiğini buldu. Skor eşikleri yanlış pozitif problemini azaltır ancak saf ML tespiti için ortadan kaldırmaz.

Neden Saf ML Alan Spesifik Belgelerde Başarısız Olur

Presidio'nun yanlış pozitif deseni, alan spesifik bağlamlarda genel amaçlı NLP modellerinin temel bir sınırlamasını yansıtır:

Hukuki belgeler, kişi isimleri ile yüzeysel desenler paylaşan özel isimler — dava isimleri, yasa isimleri, sergi tasnifleri — içerir. Genel metin üzerinde eğitilen bir model, büyük harfle yazılan özel isimlerin genellikle kişi isimleri olduğunu öğrenir. Bir hukuki belge, kişi ismi olmayan yüzlerce büyük harfle yazılmış özel isim içerir.

Sağlık belgeleri, isim kısaltmalarına benzeyen harf dizilerini içeren ilaç isimleri, cihaz isimleri ve prosedür kodları içerir. Klinik metin ayrıca isim tespiti ile öngörülemeyen bir şekilde etkileşime giren kısaltmalar ("Pt." Hasta için, "Dr." Doktor için) içerir.

Finansal belgeler, kişisel tanımlayıcılarla desen paylaşan ürün isimleri, varlık isimleri ve tanımlayıcı kodlar içerir.

Alan spesifik ayarlama bu desenleri ele alır, ancak veri setlerini ince ayar yapmak ve belge türleri geliştikçe sürekli bakım gerektirir.

Hibrit Mimari Çözümü

Yanlış pozitif problemi, yapılandırılmış verileri (regex'in %100 hassasiyet sağladığı yer) bağlamsal verilerden (ML'nin kalibre edilmiş güvenle desen tanıdığı yer) ayıran hibrit tespit ile yapısal olarak çözülebilir.

Yapılandırılmış tanımlayıcılar için Regex: SSN'ler, telefon numaraları, e-posta adresleri, kredi kartı numaraları, ulusal kimlik formatları, banka hesap numaraları. Bu formatlar belirleyicidir — bir dize ya deseni karşılar ve kontrol toplamı doğrulamasını geçer ya da geçmez. Mevcut uygulamalar için sıfır yanlış pozitif.

Bağlamsal varlıklar için NLP: Yapılandırılmamış metinde kişi isimleri, organizasyon isimleri, yerler. NLP modelleri, yapısal desenleri olmayan varlıklar için geri çağırma sağlar. Güven puanlaması ve bağlam kelime gereksinimleri yanlış pozitifleri azaltır.

Her varlık türü için eşik yapılandırması: Kişi isimleri için %90 güven eşiği belirlerken, SSN'ler için regex-güvencesi (etkili olarak %100) kullanmak, alan spesifik yanlış pozitif toleranslarına kalibrasyon sağlar. Aşırı kırpmayı tolere edemeyen hukuki ekipler daha yüksek eşikler belirler; de-identifikasyon geri çağırmasını maksimize eden klinik araştırma ekipleri daha düşük eşikler belirler.

Sonuç: saf desen eşleştirmeyle elde edilemeyen geri çağırmayı korurken, Presidio varsayılanlarından çok daha düşük yanlış pozitif oranları. Otomatik kırpma araçlarını değerlendiren hukuki ve sağlık hizmetleri organizasyonları için, hassasiyet-geri çağırma dengesi yönetilebilir — ancak yalnızca bunu yapılandırılabilir bir parametre olarak sunan bir araçla, sabit bir sistem davranışı yerine.

Verilerinizi korumaya hazır mısınız?

48 dilde 285+ varlık türü ile PII anonimleştirmeye başlayın.