Itzuli BlogeraOsasuna

Zergatik PHI Klinikoaren %50 Galdu Egiten Duten...

2025 ikerketa aipatua LLM-ak galdu egiten dituzte %50 alda PHI klinikoaren langile dokumentuetan. ChatGPT sarrerenaren %34.8 datu sentitzaileak dituzte.

April 2, 20269 min irakurri
LLM PHI detectionHIPAA de-identificationclinical NLPSafe Harbor methodhealthcare AI compliance

%50 Galtzeen Arazoa

2025 LLM-oinarritutako deanonimizazio tresnen inkesta (arXiv:2509.14464) aurkitu zuten era generalista LLM tresnak galdu egiten dituzte 50% alda PHI klinikoaren langile dokumentuetan. Hau aipatzen du oinarrizko arkitektura desadostasun: LLM-ak dituzte diseinatua hizkuntzaren ulertzea eta sorrera, ez eredu-handiak, detektzio-lanen beharrezkoen alda, dedikatu deanonimizazioa.

HIPAA Pribatutasun-Erregelaren Safe Harbor metodoak behar du kendua 18 identifikatzaile kategorietako: izenak, geografikoa datuak, datak, telefono-zenbakia, faxaren zenbakia, email helbidea, SSN, medikuntza erregistroaren zenbakia, osasun-aseguruaren benepisiano zenbakia, kontu zenbakia, sertifikatua/lizentzia zenbakia, VIN, gailuaren identifikatzailea, web URL, IP helbidea, biometriko identifikatzailea, aurpegi-aurpegi fotografiak, eta beste nahi identifikatzaile zenbakia edo kodea. Kategoria horietako bakoitzak egitura-formatuak dituzte, beharrezkoa detektzio logika espezialista.

Klinikoa oharrak dilira non zailtasun kontzentratu egiten. Hona tipiko kliniko oharren zatia: "Pt. John D., DOB 4/12/67, MRN 1234567, aurkeztu ED-n 03/15/24 bidaia-min batekin. Aurretiko Hx: HTN, DM. Dr. Smith ordentu ECG." Esaldi bakarrean bada izena, jaiotze-data, MRN, admit-data, eta tratatzaile medikua — bost HIPAA identifikatzailea, zenbaitek motzua forma, engebide kliniko motzetan.

Zer LLM-ak Galdu Egiten Dute Eta Zergatik

Genetalista LLM-ak huts egiten dute kliniko PHI-rekin aurreikus patroietan...

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.