MRN形式の問題
米国には約6,100の病院があります。各病院が独自のEHRシステムを運用しています。各病院が独自の医療記録番号(Medical Record Number)形式を使用しています。全国統一の標準規格はありません。Joint Commissionは患者を一意に識別できることを要求するだけで、形式については定めていません。
形式は多岐にわたります。7桁の整数のものもあれば、8桁のものもあります。HOSP-、MRN-、PT-などのプレフィックスを使用するものもあります。SVHS-やCHOP-などの機関コードを追加するものもあります。入院年を番号に埋め込むものもあります。
HIPAA Safe Harborは患者記録番号を18の識別子カテゴリのうち第8番目として分類しています。(45 CFR §164.514(b)(2))18すべてを削除しなければなりません。規則は形式を限定していません。病院がカスタム形式を使用している場合、それを検出する必要があります。見逃すツールは他の17種類を削除していてもSafe Harborを満たしません。
コードアプローチが失敗する理由
カスタム番号形式を匿名化パイプラインに追加する標準的な方法は、Microsoft Presidioを拡張することです。これはPythonを書くことを意味します。
開発者はEntityRecognizerを継承するクラスを作成します。正規表現を書き、Presidioのレジストリに組み込み、テストし、維持します。コードをほとんど書かないコンプライアンスチームにとって、これは大きな障壁です。形式が変わるたびにエンジニアが必要になります。
医療機関のエンジニアリングチームは多忙です。EHR統合と臨床システムを担当しています。コンプライアンスツールの優先度は高くありません。
ノーコードワークフロー
ガイド付きパターンアプローチはコーディングのステップを取り除きます。
コンプライアンス担当者がウェブアプリのCustom Entity Creatorを開きます。システムから5つのサンプル番号を貼り付けます。例えば:
SVHS-0012345
SVHS-0987654
SVHS-1122334
SVHS-4455667
SVHS-8899001
パターン生成をクリックします。AIが構造を読み取り、次を返します:
- パターン:
SVHS-\d{7} - 信頼度:高
- 推奨エンティティ名:
HOSPITAL-MRN - 推奨置換文字:
[MRN]
担当者がさらに5つのサンプルを貼り付けます。パターンが通過します。HIPAAプリセットに保存します。
それ以降、すべてのセッション(ウェブアプリ、Officeアドイン、デスクトップアプリ、API)が標準PHIパスでこの形式を検出します。コード不要です。
GDPRと研究データに関するメモ
GDPR第89条は研究データセットの仮名化を要求しています。カスタムエンティティにより、機関固有の識別子がスコープに含まれます。汎用ツールが独自形式に対して残す隙間を埋めます。
得られるもの
このワークフローは半日で完了します。カスタムコードは数週間かかります。
コンプライアンス担当者がパターンを定義し、テストし、展開します。チケット不要。待ち時間なし。プリセットには標準の17のSafe Harbor識別子と並んでカスタムエンティティが含まれます。
次の臨床メモのバッチ処理では、18の識別子タイプすべてが対象になります。Safe Harborが完了します。
医療研究のためのHIPAA Safe Harbor匿名化も参照してください。病院固有の検出パターンについてはコードなしで病院固有のMRN形式を検出するをご覧ください。