18개 식별자 요구사항
HIPAA의 프라이버시 규칙(45 CFR 섹션 164.514)은 안전 항구 비식별화 방법을 명시합니다: 보호된 건강 정보를 비식별화하기 위해 18개의 특정 식별자 카테고리를 제거해야 합니다. 안전 항구 방법은 두 가지 HIPAA 비식별화 접근 방식 중 하나이며, 준수가 결정적이기 때문에 더 일반적으로 사용됩니다 — 18개 카테고리가 모두 제거되면 데이터는 법적으로 비식별화됩니다.
18개 카테고리:
- 이름
- 지리적 데이터(주보다 작은 — 거리 주소, 도시, 카운티, 우편번호 포함)
- 개인과 관련된 날짜(연도 제외) — 생년, 입원, 퇴원, 사망
- 전화번호
- 팩스 번호
- 이메일 주소
- 사회 보장 번호
- 의료 기록 번호(MRN)
- 건강 계획 수혜자 번호
- 계좌 번호
- 인증서/면허 번호
- 차량 식별자 및 일련 번호
- 장치 식별자 및 일련 번호
- 웹 URL
- IP 주소
- 생체 인식 식별자(지문, 음성 인식)
- 정면 사진 및 유사 이미지
- 기타 고유 식별 번호 또는 코드
대부분의 PII 감지 도구는 카테고리 1, 4, 6, 7 — 이름, 전화번호, 이메일 주소 및 사회 보장 번호를 신뢰성 있게 감지합니다. 그러나 카테고리 8, 9, 10, 11, 13, 18에서는 체계적으로 실패합니다.
MRN 감지 격차
의료 기록 번호는 명시적으로 PHI 식별자(카테고리 8)로 나열됩니다. MRN 형식은 기관별로 다르며 표준화된 국가 형식이 없습니다. 병원 A는 7자리 정수를 사용합니다. 병원 B는 "PT-YYYYNNNN"을 사용하며, 여기서 YYYY는 연도이고 NNNN은 순서 번호입니다. 병원 C는 알파벳과 숫자가 혼합된 8자리 문자열을 사용합니다. 병원 D는 "MRN: " 뒤에 9자리 숫자를 사용합니다.
병원 B의 MRN 형식을 모르는 일반 PII 감지 도구는 "PT-2024-8847"를 PHI 식별자로 감지하지 못할 것입니다. 이 MRN이 포함된 문서는 표준 처리 후 비식별화된 것으로 간주됩니다 — 사실은 그렇지 않습니다.
이로 인해 조직에 보이지 않는 준수 실패 모드가 발생합니다: 도구가 위반 사항을 표시하지 않았기 때문에 비식별화가 완료된 것처럼 보입니다. 누락된 감지가 문제입니다.
맞춤형 엔터티 솔루션
MRN 감지가 필요한 의료 기관은 세 가지 옵션이 있습니다. 첫째, Presidio에서 직접 감지를 구현하는 것입니다 — MRN 형식이 발전함에 따라 Python 프로그래밍 전문 지식과 지속적인 유지 관리가 필요합니다. 둘째, MRN에 대해 특별히 수동 검토 단계를 유지하는 것입니다 — 비식별화 파이프라인에서 체계적인 약점을 생성합니다. 셋째, 코드를 요구하지 않고 AI 지원 맞춤형 엔터티 생성을 제공하는 시스템을 사용하는 것입니다.
AI 패턴 헬퍼 접근 방식: 임상 정보학 팀은 5개의 샘플 MRN 값(SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001)을 제공하고 감지 패턴을 요청합니다. AI는 정규 표현식 — SVHS-d{7} —을 생성하고 제공된 예제에 대해 유효성을 검사합니다. 패턴은 팀의 HIPAA 준수 프리셋에 저장됩니다. 이후 모든 비식별화 세션은 이 MRN 형식을 자동으로 감지합니다.
같은 접근 방식은 다른 기관별 식별자에도 적용됩니다: 건강 계획 수혜자 번호 형식, 장비 일련 번호 형식, 그리고 조직에 특정한 모든 독점 식별 코드에 적용됩니다.
출처: