La Miss Rate de PHI Clínica
En 2025, els models LLM mestre detectan PHI clínica amb:
- 60-70% precisió (positius verdaders)
- 40-60% miss rate (falsos negatius)
Això significa que per a cada 100 documents clínics, 40-60 contenen PHI que no és detectada.
Els mateixos models es venen a empreses de salut com a 'HIPAA compliant'.
Per Què Ocorre
Les notes clíniques contenen PHI en formes ambigües:
- "Mon pacient és el germà del nostre president" = identificació indirecta
- "Diagnòstic raro: casos <5/1M" = identificació indirecta
- Contextual PHI que requeria raonament semàntic
Els models LLM que entrenen en text general no aprenen a detectar aquestes formes ambigües.
Solució
anonym.legal ofereix detecció clínica especialitzada:
- Entrenament específic en notes clíniques
- Detecció de PHI indirecta
- Algoritmes de re-identificació per validar la detecció