%50 Galtzeen Arazoa
2025 LLM-oinarritutako deanonimizazio tresnen inkesta (arXiv:2509.14464) aurkitu zuten era generalista LLM tresnak galdu egiten dituzte 50% alda PHI klinikoaren langile dokumentuetan. Hau aipatzen du oinarrizko arkitektura desadostasun: LLM-ak dituzte diseinatua hizkuntzaren ulertzea eta sorrera, ez eredu-handiak, detektzio-lanen beharrezkoen alda, dedikatu deanonimizazioa.
HIPAA Pribatutasun-Erregelaren Safe Harbor metodoak behar du kendua 18 identifikatzaile kategorietako: izenak, geografikoa datuak, datak, telefono-zenbakia, faxaren zenbakia, email helbidea, SSN, medikuntza erregistroaren zenbakia, osasun-aseguruaren benepisiano zenbakia, kontu zenbakia, sertifikatua/lizentzia zenbakia, VIN, gailuaren identifikatzailea, web URL, IP helbidea, biometriko identifikatzailea, aurpegi-aurpegi fotografiak, eta beste nahi identifikatzaile zenbakia edo kodea. Kategoria horietako bakoitzak egitura-formatuak dituzte, beharrezkoa detektzio logika espezialista.
Klinikoa oharrak dilira non zailtasun kontzentratu egiten. Hona tipiko kliniko oharren zatia: "Pt. John D., DOB 4/12/67, MRN 1234567, aurkeztu ED-n 03/15/24 bidaia-min batekin. Aurretiko Hx: HTN, DM. Dr. Smith ordentu ECG." Esaldi bakarrean bada izena, jaiotze-data, MRN, admit-data, eta tratatzaile medikua — bost HIPAA identifikatzailea, zenbaitek motzua forma, engebide kliniko motzetan.
Zer LLM-ak Galdu Egiten Dute Eta Zergatik
Genetalista LLM-ak huts egiten dute kliniko PHI-rekin aurreikus patroietan...