anonym.legal
Nazaj na blogZdravstvo

PHI zaznava točnosti: John Snow Labs 96% vs. GPT-4o 79%

Nista vsa orodja za de-identifikacijo enaka. Merila ECIR 2025 kažejo F1 rezultate od 79% do 96%.

February 24, 20267 min branja
PHI detectionde-identificationNER accuracyHIPAAbenchmarks

Niso vsa orodja za de-identifikacijo enaka

Pri vrednotenju orodij za de-identifikacijo PHI je natančnost vse. 4-odstotna razlika v stopnji zaznave se morda zdi majhna – dokler si ne predstavljate, da je 4% milijonskega nabora podatkov 40.000 izpostavljenih zapisov.

Nedavna merila iz ECIR 2025 razkrivajo dramatične razlike v natančnosti zaznave PHI v vodilnih orodjih.

Rezultati merila ECIR 2025

OrodjeF1-rezultatNatančnostPriklič
John Snow Labs96%95%97%
Azure AI91%90%92%
AWS Comprehend Medical83%81%85%
GPT-4o79%82%76%

F1-rezultat kombinira natančnost (koliko zastopanosti je bilo pravilnih) in priklič (koliko dejanskih entitet je bilo zaznanih). Oboje je važno:

  • Nizka natančnost = napačne pozitivke (prekratek dopis)
  • Nizek priklič = negotove pozitivke (propuščeni PII = kršitve)

Zakaj obstaja razlika

Razlike podatkov za usposabljanje

OrodjeFokus usposabljanja
John Snow LabsZdravstvo, klinični zapiski
Azure AISplošno medicinsko + klinično
AWS ComprehendSplošno medicinsko
GPT-4oŠirok trening, ne zdravstvo

Modeli John Snow Labs so trenirani posebej na klinični dokumentaciji – nemirnem, okrajšanem, odvisnem od konteksta besedilu, ki ga zdravstvo proizvaja.

Ste pripravljeni zaščititi svoje podatke?

Začnite z anonimizacijo PII z več kot 285 tipi entitet v 48 jezikih.