返回博客医疗保健

无代码的自定义MRN检测:将医院特定标识符添加到您的HIPAA管道

医疗记录号码是医院特定的——每个医疗系统使用不同的格式。HIPAA安全港要求去除MRN。通用PII工具无法检测专有格式。AI辅助的模式创建在不到2分钟内从5个样本值生成经过验证的正则表达式。

April 20, 20268 分钟阅读
custom MRN detectionHIPAA pipeline configurationno-code regexAI pattern helperhospital identifier de-identification

MRN格式碎片化问题

美国大约有6100家医院,每家医院都运行自己的电子健康记录系统,使用自己的医疗记录号码格式。没有国家MRN标准。认证医疗组织的联合委员会规定,MRN必须在系统内唯一标识患者——但并未规定格式。

结果:实际使用中的MRN格式包括7位整数、8位整数、长度不一的字母数字字符串、带有前缀代码的格式化字符串(HOSP-、MRN-、PT-、PAT-)、附加的机构代码(SVHS-、CHOP-、MDACC-)以及日期编码格式,其中注册年份嵌入在号码中。

HIPAA的安全港去标识化方法将医疗记录号码列为18个标识符中的第8类,必须去除(45 CFR第164.514(b)(2)节)。该要求不受格式限制——组织使用的所有MRN格式都必须被检测和去除。一个处理临床笔记但未检测其特定MRN格式的组织,无论去除了其他什么标识符,都无法实现HIPAA安全港去标识化。

编码障碍

将自定义MRN格式添加到去标识化管道的标准方法需要在Presidio的自定义识别器框架中实现该格式。这涉及到:

编写一个扩展EntityRecognizer的Python类,定义特定MRN格式的正则表达式模式,实现应用该模式的analyze()方法,将识别器添加到Presidio注册表中,针对代表性样本测试实现,并在格式演变时维护实现。

对于没有Python专业知识的临床信息学团队——这描述了大多数医疗合规和隐私工作人员——这就造成了对工程团队的依赖,任何格式更改都需要他们的支持。医疗组织中的工程资源通常分配给EHR集成和临床决策支持,而不是合规工具配置。

AI模式助手

AI辅助的模式创建方法用引导界面替代了编码工作流程:

临床信息学团队在Web应用程序中打开自定义实体创建器。他们提供来自其系统的5个样本MRN值(SVHS-0012345、SVHS-0987654、SVHS-1122334、SVHS-4455667、SVHS-8899001)。他们点击“生成模式”。AI分析样本结构并返回:模式SVHS-d{7}与提供的示例匹配;置信水平高;建议的实体名称:HOSPITAL-MRN;建议的替换: [MRN];测试其他样本以验证。

团队提供5个额外的测试样本。模式验证正确。自定义实体被保存到HIPAA合规预设中。所有后续的去标识化会话——Web应用程序、Office插件、桌面应用程序和API——都自动将SVHS格式的MRN作为标准PHI检测的一部分进行检测。

根据第89条的GDPR研究豁免要求,研究数据集必须进行假名化和数据最小化。自定义实体创建确保将特定于机构的标识符包含在假名化范围内——填补通用工具对专有格式留下的覆盖空白。

来源:

准备好保护您的数据了吗?

开始使用 285 种实体类型在 48 种语言中匿名化 PII。