Tornar al BlogSanitat

Taxa de Miss PHI Clínica LLM: La Crisi d'Investigació...

[CA] Els models LLM detecten PHI clínica amb 40-60% de miss rate. Els mateixos models es venen a empreses de salut com a 'HIPAA compliant'.

April 2, 20269 min llegit
LLM PHI detectionHIPAA de-identificationclinical NLPSafe Harbor methodhealthcare AI compliance

La Miss Rate de PHI Clínica

En 2025, els models LLM mestre detectan PHI clínica amb:

  • 60-70% precisió (positius verdaders)
  • 40-60% miss rate (falsos negatius)

Això significa que per a cada 100 documents clínics, 40-60 contenen PHI que no és detectada.

Els mateixos models es venen a empreses de salut com a 'HIPAA compliant'.

Per Què Ocorre

Les notes clíniques contenen PHI en formes ambigües:

  • "Mon pacient és el germà del nostre president" = identificació indirecta
  • "Diagnòstic raro: casos <5/1M" = identificació indirecta
  • Contextual PHI que requeria raonament semàntic

Els models LLM que entrenen en text general no aprenen a detectar aquestes formes ambigües.

Solució

anonym.legal ofereix detecció clínica especialitzada:

  • Entrenament específic en notes clíniques
  • Detecció de PHI indirecta
  • Algoritmes de re-identificació per validar la detecció

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.