18識別子要件
HIPAAのプライバシールール(45 CFR Section 164.514)は、セーフハーバーの非識別化方法を指定しています:保護された健康情報を非識別化するためには、18の特定の識別子カテゴリを削除する必要があります。セーフハーバー方式は、HIPAAの非識別化アプローチの2つのうちの1つであり、コンプライアンスが決定論的であるため、より一般的に使用されます — すべての18カテゴリが削除されれば、データは法律上非識別化されたものと見なされます。
18のカテゴリ:
- 名前
- 地理データ(州より小さい — 住所、都市、郡、郵便番号を含む)
- 個人に関連する日付(年を除く) — 生年月日、入院日、退院日、死亡日
- 電話番号
- ファックス番号
- メールアドレス
- 社会保障番号
- 医療記録番号(MRN)
- 健康保険受益者番号
- アカウント番号
- 証明書/ライセンス番号
- 車両識別子およびシリアル番号
- デバイス識別子およびシリアル番号
- ウェブURL
- IPアドレス
- 生体識別子(指紋、音声印)
- 顔全体の写真および同等の画像
- その他のユニークな識別番号またはコード
ほとんどのPII検出ツールは、カテゴリ1、4、6、7 — 名前、電話番号、メールアドレス、社会保障番号を信頼性高く検出します。彼らは体系的にカテゴリ8、9、10、11、13、18で失敗します。
MRN検出のギャップ
医療記録番号はPHI識別子(カテゴリ8)として明示的にリストされています。MRN形式は機関特有であり、標準化された国の形式はありません。病院Aは7桁の整数を使用します。病院Bは「PT-YYYYNNNN」を使用し、YYYYは年、NNNNはシーケンス番号です。病院Cはアルファベットと数字の8文字の文字列を使用します。病院Dは「MRN: 」の後に9桁の番号を使用します。
病院BのMRN形式を知らない一般的なPII検出ツールは、「PT-2024-8847」をPHI識別子として検出できません。このMRNを含む文書は、標準処理の後に非識別化されたものとして扱われます — それはそうではありません。
これにより、組織には見えないコンプライアンスの失敗モードが生じます:非識別化は完了しているように見えますが、ツールは違反をフラグしませんでした。欠落した検出が問題です。
カスタムエンティティソリューション
MRN検出が必要な医療機関には3つのオプションがあります。まず、Presidioで直接検出を実装すること — これはMRN形式が進化するにつれてPythonプログラミングの専門知識と継続的なメンテナンスを必要とします。次に、MRN専用の手動レビュー手順を維持すること — これは非識別化パイプラインに体系的な弱点を作成します。第三に、コードを必要とせずにAI支援のカスタムエンティティ作成を提供するシステムを使用することです。
AIパターンヘルパーアプローチ:臨床情報学チームは5つのサンプルMRN値(SVHS-0012345、SVHS-0987654、SVHS-1122334、SVHS-4455667、SVHS-8899001)を提供し、検出パターンを要求します。AIは正規表現を生成します — SVHS-d{7} — そして提供された例に対してそれを検証します。パターンはチームのHIPAAコンプライアンスプリセットに保存されます。その後のすべての非識別化セッションは、このMRN形式を自動的に検出します。
同じアプローチは、他の機関特有の識別子にも適用されます:健康保険受益者番号形式、機器シリアル番号形式、および組織特有の任意の専有識別コード。
出典: