Կես-Բաց Թողնելու Խնդիրը
2025 թ. ուսումնասիրությունը (arXiv:2509.14464) LLM գործիքներն ստուգեց կլինիկական գրառումների վրա: Արդյունքները վատ էին: Այս գործիքները բաց թողեցին բազմալեզու փաստաթղթերի կլինիկական PHI-ի ավելի քան 50%-ը: Պատճառը պարզ է: LLM-ները ստեղծված են տեքստային ելք ձևավորելու համար: Դրանք ստեղծված չեն HIPAA-ի պահանջած բարձր-կտրող հայտնաբերման առաջադրանքի համար:
HIPAA Safe Harbor-ն ունի 18 պաշտպանված նույնացնող տեսակ: Անուններ, ամսաթվեր, հեռախոսահամարներ, SSN-ներ, MRN-ներ, առողջապահական ծրագրի ID-ներ, սարքի ID-ներ և IP հասցեներ: Յուրաքանչյուրն ունի իր հայտնաբերման տրամաբանությունը:
Կլինիկական գրառումներն ավելի են բարդացնում: Վերցրեք այս օրինակը. "Հ/ն Ջ. Դ., ծ/թ 4/12/67, MRN 1234567, ընդ/ված 03/15/24, Դ-ր Սմիdhy ECG-ի հրաման արեց:" Մեկ նախադասություն: Հինգ պաշտպանված նույնացնիչ: Մեծ մասն օգտագործում է կրճատ ձևեր: Կլինիկական իմաստ հասկանալու մոդելն հաճախ ձախողում է հայտնաբերման առաջադրանքը:
Ինչ են LLM-ները Բաց Թողնում և Ինչու
LLM գործիքները ձախողվում են կլինիկական գրառումների վրա հաստատված ձևերով:
Կրճատ ձևի նույնացնիչներ: Կլինիկական գրառումներն օգտագործում են կրճատումներ: Ծ/թ, MRN և Հ/ն սովորական ձևեր են: Կլինիկական իմաստ հասկանալու մոդելն "|Հ/ն Ջ. Դ."|-ն անուն չի ճանաչի: Զգայուն տվյալ արդյունահանումն ունի տարբեր նպատակ:
Համատեքստային ամսաթվեր: Ոչ բոլոր ամսաթվերն ունեն նույն ռիսկ: "67 տ." փափուկ ցուցիչ է: "Ծ/թ 4/12/67" ուղղակի պաշտպանված նույնացնիչ է: "03/15/24" ընդունման ամսաthiv-ines pashptanvats e: Dzevachanoumy miayn anori bavor che:
Ոչ ամeriakayin dzevachner: Cyberhaven-n (Q4 2025) parzets, vor ChatGPT-i bolor moutkagnoumneri 34.8%-n poutsum e zgayun tvyal, shnorhiv bazmalezou PII: Achoghapahoutyoun volorty mej da nshanakum e voch-ameriakyin graromin ID-ner, tartsrayin amsakatvi dzevachner yev tartsrayin achoghapahoutyoun ID tesakner: Ameriakyi vra ousoutsvats gortsikner-n sarankn hastatun bad en thognoom:
Hivandantsi hatuk nshanoghichner: Hivandantsner-n ounin ir sorovanakar MRN dzevachner, andznakazmeri ID-ner yev kayki kodner: Standart NER ousotsayin tvyaleroum sarank ner en: Hatuk kazmatomi ajaktsoutyun chunetsogi gortsik-n drain chi gtnelou:
Hatoukagitakan Tvyalabazi Risky
500,000 grarumneri veraberi hatoukagitakan tvyalabaz kanokhogh hivandantsy ounee irakal hamapataskhoutyan khndiran: HIPAA-n apanuynakants tvyalneri hamar patahroom e "shat poqr risk" standart: Pashtpanvats nshanoghichner-i kasin bad thoghnoghe gortsik-n chi karogi bavaranel ayd chaporokin:
Hatoukagitakan arkivner-n mak tvyal chen: Grarumnern taratsvoum en bazmazegh batjaranumneri, zhamanakabashneri yev eramanis lezouneri vra: Hashvarkayin tvalneri vra lav ashkhataghoghe gortsik-n karogi e dzakhogvel patmolokayin grarumneri vra: Azat tekstoum zgayun tvyal-n volorti piteketian chi ounenom:
IRB hastatoutyouny avel patharutyunner e avelajnum: Kazmakerputiunner-n peti e tsuyts ten kirakarstsvats metody, hanerakvatstsi nshanoghich tesaknern yev kapvats stouzkumnern: Bolor grarumneri kasin bad thoghnoghe gortsik-n chi karogi bavaranel ayd patharutyunnery:
Tesek mern hamapataskhoutyan aknarky yev antangoutyan iraroutsnery te inch pes anonym.legal-n HIPAA ashkhatin e ajaktsooum:
Yerreks-Shert Loutsoumy
2025 th. hetazotoutyouny mek hast dzev parzel e: Amsena poqr bad thoghnelou arazheknery ounetsoghe gortsikner kortsratsin en haytnaberoutyan yerreks shert:
Aradjin shert — regex: Gtnoum e karou-zakayin nshanoghichner: SSN-ner, MRN-ner, herakhosamnery, achoghapahoutyoun tsragri ID-ner: Hamoveli e amsrin dzevachneri vra:
Yerkrord shert — NER: Kortsnoum e transformer modelner: Gtnoum e anunner, amsakativer yev zgayun tvyal patmolokayin tekstoum: Ashkhatum e ayteghe, vortegh regex-n chi karogi:
Yerrord shert — hatuk kazmatomer: Kayki-hatuk dzevery kararoum e: Sorovakan MRN dzevanoumshner, andznakazmeri ID-ner, kayki kodner: Voch mek standart model drain chi tsatsoum:
Miak ML gortsikner-n vaternoom en qarr tzevery yev voch-anglieren teksti vra: Miak regex gortsikner-n bad en thognoum volorti piteketian chunetsoghe zgayun tvyal: Vech mekn miayn bavor che:
Miayn yerreks-sherty ounetsoghe dzevavoratsoutyoun-n hetazototyounoum harghel e 5%-its pes bad thoghnelou arazheknery: Aysd e HIPAA Safe Harbor hamapataskhoutyan chaporokin:
Hetagha kagheritsi hamar tesek mern utsoutsichy HIPAA Safe Harbor apanshanoghacoutyouni vraberoum hatoukagitakan hetazotoutyan hamar: