ผลการทดสอบ ECIR 2025
| เครื่องมือ | F1-Score | Precision | Recall |
|---|---|---|---|
| John Snow Labs | 96% | 95% | 97% |
| Azure AI | 91% | 90% | 92% |
| AWS Comprehend Medical | 83% | 81% | 85% |
| GPT-4o | 79% | 82% | 76% |
ทำไมความแตกต่าง 17% จึงสำคัญ
โรงพยาบาลประมวลผล 1,000,000 บันทึกต่อปี:
- John Snow Labs (96%): พลาด 40,000 บันทึก
- GPT-4o (79%): พลาด 210,000 บันทึก
ความแตกต่าง: 170,000 ผู้ป่วยที่มีความเสี่ยง
แหล่งที่มา: