Späť na blogZdravotná Starostlivosť

Presnosť detekcie PHI: John Snow Labs 96% vs. GPT-4o 79%

Nie všetky nástroje de-identifikácie sú rovnaké. Porovnávacie testy ECIR 2025 ukazujú skóre F1 od 79% do 96%.

February 24, 20267 min čítania
PHI detectionde-identificationNER accuracyHIPAAbenchmarks

Nie všetky nástroje de-identifikácie sú rovnaké

Keď hodnotíte nástroje na de-identifikáciu PHI, presnosť je všetko. Rozdiel 4% v miery detekcie sa môže zdať malý—až kým si neuvedomíte, že 4% z milióna záznamov dataset je 40 000 odhalených záznamov.

Nedávne porovnávacie testy z ECIR 2025 odhaľujú dramatické rozdiely v presnosti detekcie PHI v rámci vedúcich nástrojov.

Výsledky porovnávacích testov ECIR 2025

NástrojSkóre F1PresnosťSpätný vznik
John Snow Labs96%95%97%
Azure AI91%90%92%
AWS Comprehend Medical83%81%85%
GPT-4o79%82%76%

Skóre F1 kombinuje presnosť (koľko detegovaných entít bolo správnych) a spätný vznik (koľko skutočných entít bolo detegované). Obidve na vážnosti:

  • Nízka presnosť = falošné pozitíva (nadmerná redakcia)
  • Nízky spätný vznik = falošné negatíva (zmeškané PII = porušenia)

Prečo rozdiel existuje

Rozdiely v trénovacích údajoch

NástrojZameranie trénovania
John Snow LabsŠpecifické pre zdravotníctvo, klinické noty
Azure AIVšeobecné medicínske + klinické
AWS ComprehendVšeobecné medicínske entity
GPT-4oRozsáhle trénovanie, nie špecifické pre zdravotníctvo

Modely John Snow Labs sú trénované špecificky na klinickej dokumentácii—neporiadnej, skrátenej, kontextne závislej texte, ktorý zdravotníctvo skutočne vyrábí.

Pokrytie typu entity

Nie všetky nástroje detegujú rovnaké entity:

| Entity | John Snow | Azure | AWS | GPT-4o | |--------|-----------|-------|-----|------...

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.