あなたのツールが見逃す18のHIPAA識別子
2026年版に更新済み。
HIPAAは18のPHI識別子カテゴリを列挙しています。ほとんどの匿名化ツールが検出できるのはせいぜい6つです。残りの12は検出されずに通過し、それぞれがコンプライアンスの抜け穴となります。
セーフハーバー規則
HIPAAのプライバシー規則(45 CFR § 164.514)はセーフハーバー非識別化方法を定義しています。18のすべての識別子カテゴリを削除しなければなりません。すべて削除すれば、データは法律上、非識別化されたとみなされます。これがセーフハーバーが普及している理由です。合否判定であり、裁量の余地がありません。
18のカテゴリは以下のとおりです:
- 氏名
- 州より小さい地理データ — 住所、市区町村、郡、郵便番号
- 年を除く日付 — 生年月日、入院日、退院日、死亡日
- 電話番号
- FAX番号
- メールアドレス
- 社会保障コード
- 患者記録識別子(MRN)
- 健康保険受益者コード
- 口座識別子
- 証明書・免許コード
- 車両識別子およびシリアルコード
- デバイス識別子およびシリアルコード
- WebのURL
- IPアドレス
- 生体識別子 — 指紋、声紋
- 顔全体の写真および類似画像
- その他の一意な識別コードまたは値
ほとんどのツールはカテゴリ1、4、6、7(氏名、電話番号、メールアドレス、社会保障コード)を適切に処理します。カテゴリ8、9、10、11、13、18を定期的に見逃します。
MRNの抜け穴
患者記録識別子はカテゴリ8に含まれます。MRNの形式は各病院が独自に設定します。米国には統一された標準形式がありません。
病院Aは7桁の整数を使用します。病院Bは「PT-YYYYNNNN」を使用します。病院Cは8文字の英数字を使用します。病院Dは「MRN:」に続けて9桁のコードを記載します。
汎用ツールは「PT-2024-8847」をPHIとしてフラグしません。文書は非識別化チェックを通過します。しかし非識別化されていません。アラートは発生しません。チームは作業完了と思い込みます。実際には完了していません。
これは最も危険な種類の抜け穴です。サイレントな抜け穴です。
3つの対処法
Presidioでコーディングする。 Pythonのスキルと継続的なメンテナンスが必要です。機能しますが時間がかかります。
手動レビューを追加する。 担当者が各文書のMRNを確認します。これはスケールしません。
AI支援カスタムエンティティ作成を使用する。 コード不要です。チームがサンプル値を提供し、AIがパターンを構築します。
実際の流れです。チームが5つのサンプルMRN値を提供します:SVHS-0012345、SVHS-0987654、SVHS-1122334、SVHS-4455667、SVHS-8899001。AIはSVHS-\d{7}を返し、サンプルに対して検証します。チームはHIPAAプリセットに保存します。以降のすべてのセッションでこの形式が自動的に検出されます。同じアプローチが受益者コードやデバイスシリアルコードにも適用できます。
プリセットの仕組みはHIPAA MRN検出ガイドで確認できます。AIパターンワークフローについても詳しく説明しています。
見落とされがちな前提
多くのチームは名前と電話番号を含むサンプル文書でテストします。ツールは合格します。完全なカバレッジと思い込みます。しかしサンプルに機関固有の識別子が含まれることはほとんどありません。MRNや受益者コードは汎用ツールには無作為な文字列に見えます。フラグなしで通過してしまいます。
真のセーフハーバー監査は18のカテゴリすべてを検出方法に対応付けます。カテゴリ8については、自病院の実際のMRNサンプルで検証してください。ツールがあなたの形式を知っていると仮定しないでください。
完全なフレームワークはHIPAAコンプライアンス概要でご確認ください。
結論
セーフハーバーは18のすべての識別子カテゴリの削除を求めています。汎用ツールはそのごく一部しかカバーしません。MRN、受益者コード、デバイスシリアルコードなどの抜け穴には標準形式がなく、汎用ツールは見逃します。AI支援カスタムエンティティはコードや手動レビューなしに抜け穴を埋めます。
参考文献
- HHS:HIPAA Safe Harbor、45 CFR § 164.514 — hhs.gov。VERIFIED。
- Shaip:医療非識別化におけるPHI識別子の種類 — shaip.com。VERIFIED-EXTERNAL。
- HHS OCR:2024年更新の非識別化ガイダンス — hhs.gov。VERIFIED。