anonym.legal
กลับไปที่บล็อกการดูแลสุขภาพ

อัตราการพลาดของ LLM ในการตรวจจับ PHI ทางคลินิก...

การศึกษาวิจัย HIPAA ใหม่ชี้ให้เห็นว่า ChatGPT และ Claude ทุกรุ่นข้างนอกมี miss rate 15-21% ในการตรวจจับ PHI ตัวเลขนั้นเท่ากับ 150,000-210,000...

April 2, 20269 อ่านประมาณ
LLM PHI detectionHIPAA de-identificationclinical NLPSafe Harbor methodhealthcare AI compliance

การศึกษาวิจัย HIPAA ใหม่ล้มเหลว LLM

การศึกษาวิจัยเมื่อไม่นานมานี้จาก HIPAA Journal ทดสอบ ChatGPT 4o, Claude 3.5 Sonnet และ Gemini 2.0 ในการตรวจจับ PHI ในหมายเหตุคลินิก

LLMAccuracy (F1)PrecisionRecall (Miss Rate)
John Snow Labs96%95%97%
Azure AI Medical91%90%92%
GPT-4o79%82%76%
Claude 3.5 Sonnet81%80%82%
Gemini 2.078%80%76%

ความหมาย HIPAA

โรงพยาบาล 1 ล้านผู้ป่วย:

GPT-4o (79% F1 = 21% miss rate):

  • Miss 210,000 บันทึก PHI ที่ไม่ได้ตรวจจับ
  • ไม่สอดคล้องกับ HIPAA
  • OCR ผลิต liability

John Snow Labs (96% F1 = 4% miss rate):

  • Miss เพียง 40,000 บันทึก
  • สอดคล้องกับมาตรฐาน HIPAA

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

เริ่มทำให้ PII เป็นนิรนามด้วยประเภทเอนทิตีมากกว่า 285 ประเภทใน 48 ภาษา.