2026年更新版
HIPAA安全港去标识化:无需工程师检测医院专属MRN格式
HIPAA安全港要求删除病历号(MRN),这是18类必须删除的标识符之一。听起来简单,问题在于MRN格式并无统一标准。
Epic有一套格式,Cerner是另一套,Meditech又是另一套。每家医院还会附加自己的代码,区域医疗集团则会产生更多格式。通用PII工具无法知晓您机构的格式,因此会漏掉您的MRN。
这不是小风险。医疗IT团队经常发现,本以为已去标识化的数据集中仍然存在MRN,原因就是工具只配置了常见PII类型。
MRN格式难题
美国没有统一的病历号国家标准,每家医院或EHR供应商都自行定义格式。
常见格式举例:
- Epic格式: 8至12位纯数字(如123456789)
- Cerner格式: 医院代码前缀+数字(如MGH-987654)
- 区域医疗网络: 机构代码+年份+序列号(如HOSP-2023-456789)
- 退伍军人事务部: 9位含校验位数字
- 儿科系统: 患者类型前缀+数字(如PED-12345678)
没有任何单一规则能匹配所有格式,MRN没有通用模式。
通用PII工具能检测的内容: 大多数HIPAA工具专注于固定格式的标识符——SSN遵循XXX-XX-XXXX格式,电话号码遵循XXX-XXX-XXXX格式,电子邮件地址有固定形式,这些容易识别。
MRN、账户号码和执照号码是HIPAA第8、10和11类标识符,它们因医院而异,需要自定义配置,通用工具无法捕捉。
合规漏洞
某区域医院希望与大学研究伙伴共享患者数据,其EHR使用以下MRN格式:HOSP-YYYY-XXXXXX。
他们通过HIPAA工具处理数据,工具删除了姓名、日期、电话号码和SSN,但没有删除MRN——HOSP-2023-456789不匹配任何内置规则。
研究人员获得了数据集,并将其与自己持有的记录(包含同一医院过往转诊的MRN)进行关联。许多患者因此被重新识别。该医院发生了HIPAA数据泄露事件。
这是真实存在的失效模式。另请参阅HIPAA安全港医疗研究去标识化,了解安全港在哪些方面容易失效。
解决方案:自定义实体创建
解决方法是将您的MRN格式定义为自定义实体,合规负责人可以完成这项工作,无需工程师介入。
操作步骤:
-
写出格式描述:「以HOSP开头,接一个连字符,再接4位年份,连字符,再接6位数字」
-
使用AI工具生成正则表达式:HOSP-\d{4}-\d{6}
-
在20份出院摘要上测试,确认所有MRN均被捕获
-
将其保存为名为「医院病历号」的自定义实体
-
将其添加到您的HIPAA预设中,与标准17类标识符并列
合规负责人完成这一流程约需3天,而开发自定义代码可能需要3个月。
案例:15家机构的医院网络
组织: 15家机构的区域医院网络
MRN格式: HOSP-YYYY-XXXXXX(存在于数千份出院摘要PDF中)
目标: 依据HIPAA数据使用协议与大学伙伴共享研究数据集
原方案: 外部去标识化供应商,年费12万美元
发现的漏洞: 供应商工具无法检测机构专属MRN格式
新工作流程:
- 合规负责人定义MRN格式——20分钟
- AI验证正则表达式——5分钟
- 在50份样本摘要上测试——30分钟
- 确认无MRN遗漏、无误报——10分钟
- 将自定义实体添加至HIPAA预设
- 对完整的5万条记录数据集进行批量处理
消除漏洞的总用时:一个下午。
多机构网络:多种MRN格式
通过并购建立的医院网络通常运行多个EHR系统,每个遗留系统可能使用不同的MRN格式。
处理方法:
为每种格式创建单独的自定义实体:
- 「MRN格式A(Epic)」——8位纯数字
- 「MRN格式B(旧版Cerner)」——前缀+7位数字
- 「MRN格式C(并购关联机构)」——州代码+年份+序列号
一个预设包含所有三个自定义实体以及标准HIPAA标识符类型,来自所有机构的每一份文件都会删除其MRN。
请参阅无代码HIPAA管道中的自定义MRN检测,获取多格式配置的分步指南。
超越MRN:其他非标准标识符
同样的方法适用于其他HIPAA安全港标识符类型。
医疗保险成员号(第9类): 每家保险公司使用自己的格式,安泰、蓝十字和联合健康格式各不相同,账单团队需要为每家付款方建立自定义格式。
账户号码(第10类): 医院账单账号因医院而异。
执照号码(第11类): DEA号码有联邦统一格式,各州医疗执照号没有,每个州立委员会有自己的格式。
设备标识符(第14类): 医疗器械序列号由各厂商自行设定。
对于每一类,自定义实体都能消除漏洞,无需工程师介入。
请参阅组织匿名化的自定义PII标识符,了解更多非标准标识符类型的信息。
验证:证明安全港合规性
HIPAA安全港规定,被覆盖实体不得有「实际知晓」数据可能识别某人的情形(45 CFR §164.514(b)(1))。
自定义实体验证可证明18类标识符均已覆盖。
验证步骤:
- 对研究数据集中50至100份样本文件进行处理
- 审查输出——是否有任何内容看起来像标识符?
- 进行第二次检测以捕获遗漏项
- 记录操作过程
您的自定义实体配置、样本审查记录和处理日志共同构成安全港合规记录。
结论
使用默认设置的通用PII工具无法完成HIPAA安全港去标识化。病历号是医院专属的,需要自定义检测。
自定义实体创建可在数小时内消除这一漏洞。合规负责人可以定义格式、测试格式并处理数据,无需任何工程工作。
「我们运行了HIPAA工具」和「我们删除了安全港要求的全部18类标识符」之间的差距,往往只是一个缺失的自定义实体。