人工智能临床文档隐私问题
部署人工智能用于临床文档的医疗机构——语音转录、笔记生成、临床决策支持——面临着手动审查无法可靠弥补的HIPAA合规缺口。
人工智能生成的临床笔记引入了三种传统文档工作流程所没有的PHI暴露向量:
- 交叉污染:基于先前患者互动训练的人工智能可能会将一个患者的PHI纳入另一个患者的记录中——这一现象在大型语言模型医疗应用的研究中有文献记录。
- 上下文渗漏:PHI出现在不应存在的字段中(研究笔记、账单叙述、保险转介)——人工智能根据输入上下文填充字段,而不是字段意图。
- 训练管道暴露:许多人工智能文档供应商会在未明确选择退出的情况下发送笔记以进行模型质量改进——这将PHI传输给可能没有适当BAA的第三方处理者。
2025年HHS提议的人工智能风险分析规则明确要求“使用人工智能工具的实体必须将这些工具纳入其风险分析中。”这为人工智能辅助的临床工作流程创造了正式的文档要求。
2025年HHS人工智能风险分析框架
HHS针对使用人工智能工具的HIPAA覆盖实体的2025年提议法规为安全规则风险分析过程增加了具体要求:访问、使用或生成PHI的人工智能系统必须包含在覆盖实体的风险分析文档中。
这创造的实际要求:
技术保障评估: 每个人工智能临床文档工具必须评估:
- 它是否在覆盖实体的基础设施外传输PHI?
- 它在处理后是否服务器端存储PHI?
- 它是否在可能不适合目标记录的输出中生成PHI?
行政保障: 劳动力培训必须解决特定于人工智能的PHI风险,包括交叉污染场景。
物理保障: 使用人工智能文档工具的工作站必须纳入物理访问控制。
对于大多数覆盖实体,“人工智能临床文档工具”类别包括:语音转文本转录服务、人工智能笔记起草工具、临床决策支持系统和编码自动化工具。
为什么实时预保存检测满足HHS要求
最直接满足HHS人工智能风险分析要求的技术控制是EHR提交之前的实时PHI检测。
以下是这在架构上重要的原因:
没有预保存检测:
- 人工智能生成笔记草稿
- 临床工作人员审查(手动,时间紧迫)
- 笔记提交到EHR
- 任何PHI错误——交叉污染、错误标识符——现在都在永久医疗记录中
- 更正需要审计跟踪条目、通知分析、潜在泄露评估
有预保存检测:
- 人工智能生成笔记草稿
- 在EHR提交之前运行自动PHI扫描
- 检测到的实体标记供临床工作人员审查
- 临床工作人员在提交之前确认或更正
- EHR记录从创建开始就是干净的
预保存检测步骤满足HIPAA安全规则164.312(b):审计控制必须“实施记录和检查信息系统活动的硬件、软件和/或程序机制。”预保存检测创建了每个临床笔记PHI内容审查的自动审计记录。
人工智能上下文中的18个HIPAA PHI标识符
HIPAA安全港去标识化要求去除18个特定的PHI标识符(45 CFR 164.514(b))。在人工智能生成的临床文档中,所有18个标识符可能意外出现:
- 姓名 — 患者在症状描述中提到家庭成员的姓名
- 地理数据 — 社会历史中提到的家庭地址
- 日期 — 出生日期、入院日期、手术日期
- 电话/传真号码 — 转介上下文中的联系信息
- 电子邮件地址 — 患者提供的联系详情
- 社会安全号码 — 保险验证上下文
- 医疗记录号码 — 在人工智能生成的摘要中交叉引用
- 健康计划受益人号码 — 保险上下文
- 账户号码 — 账单上下文
- 证书/许可证号码 — 转介中的提供者凭证
- 车辆标识符 — 创伤笔记中的事故上下文
- 设备标识符 — 植入物文档
- 网址 — 患者提交的健康记录链接
- IP地址 — 远程医疗会话元数据
- 生物识别标识符 — 指纹、语音数据引用
- 全脸照片 — 在人工智能系统中的链接媒体
- 任何其他唯一识别号码 — 自定义设施标识符
经过多样文本训练的人工智能语言模型可能会从上下文中生成这些标识符中的任何一个。预保存检测必须覆盖所有18个——不仅仅是显而易见的(社会安全号码、日期)。
在临床工作流程中实施预保存PHI检测
临床文档预保存检查的实际工作流程集成:
草稿审查阶段:
- 人工智能生成笔记草稿
- 笔记文本在显示给临床工作人员之前发送到PHI检测API
- 检测到的实体在草稿界面中突出显示
- 临床工作人员作为文档审查的一部分审查突出显示的内容
- 确认的笔记在没有标记标识符(或有明确临床理由)的情况下提交到EHR
技术要求:
- 延迟:实时集成的延迟低于200毫秒(检测不得减慢文档工作流程)
- 覆盖范围:所有18个HIPAA标识符加上上下文模式(特定于设施的MRN格式)
- 置信评分:高置信度实体(>85%)自动标记;中等置信度(50-85%)需要明确审查;低置信度仅作为信息呈现
- 审计跟踪:每个检测到的实体、置信水平和审查者决策记录
对于HHS人工智能风险分析文档要求,预保存检测的审计跟踪提供了技术证据,证明组织已为人工智能生成的PHI实施了适当的保障措施。
用例:学术医疗中心预保存集成
一家使用人工智能环境文档系统(医生笔记的语音转文本)的学术医疗中心在发现90天审计中的两个交叉污染实例后实施了预保存PHI检测:一份笔记包含了提到的患者的出生日期,另一份包含了在社会历史中提到的家庭成员的姓名和社会安全号码。
预保存检测集成:
- 100%的人工智能生成的笔记草稿在医生审查之前扫描
- 平均检测延迟:47毫秒(在工作流程中不可感知)
- 在90天内:在8400份笔记中标记了1247个PHI实体
- 临床工作人员审查并确认/更正了94%的标记实体
- 实施后没有交叉污染事件
对于HHS风险分析文档:系统生成每月摘要,显示检测率、审查率和实体类型分布——提供HIPAA安全规则164.312(b)所需的“审计控制”证据。
来源: