당신의 도구가 놓치는 HIPAA 18개 식별자
2026년 기준으로 업데이트됨.
HIPAA는 18개의 PHI 식별자 범주를 규정합니다. 대부분의 익명화 도구는 6개 정도만 감지합니다. 나머지 12개는 통과되며, 이는 각각 컴플라이언스 위반으로 이어집니다.
세이프 하버 규칙
HIPAA 개인정보 보호 규칙(45 CFR § 164.514)은 세이프 하버 비식별화를 정의합니다. 18개 식별자 범주를 모두 제거해야 합니다. 전부 제거하면 법적으로 비식별화된 데이터로 인정됩니다. 세이프 하버가 널리 사용되는 이유가 바로 이것입니다. 통과 또는 실패, 판단의 여지가 없습니다.
18개 범주는 다음과 같습니다:
- 이름
- 주보다 작은 단위의 지리 데이터 — 주소, 시, 군, 우편번호
- 연도를 제외한 날짜 — 출생일, 입원일, 퇴원일, 사망일
- 전화번호
- 팩스번호
- 이메일 주소
- 사회보장번호
- 의료 기록 식별자(MRN)
- 건강보험 수혜자 코드
- 계정 식별자
- 자격증 및 면허 코드
- 차량 식별자 및 일련번호
- 기기 식별자 및 일련번호
- 웹 URL
- IP 주소
- 생체 식별자 — 지문, 음성 패턴
- 전체 얼굴 사진 및 유사 이미지
- 기타 고유 식별 코드 또는 값
대부분의 도구는 1번, 4번, 6번, 7번 범주를 잘 처리합니다. 8번, 9번, 10번, 11번, 13번, 18번은 일상적으로 놓칩니다.
MRN 탐지 격차
의료 기록 식별자는 8번 범주에 해당합니다. MRN 형식은 각 병원이 자체적으로 정합니다. 미국에는 표준 형식이 없습니다.
A 병원은 7자리 정수를 사용합니다. B 병원은 "PT-YYYYNNNN" 형식을 씁니다. C 병원은 8자리 영숫자 문자열을 사용합니다. D 병원은 9자리 코드 앞에 "MRN: "을 붙여 씁니다.
범용 도구는 "PT-2024-8847"을 PHI로 식별하지 않습니다. 문서는 비식별화 검사를 통과합니다. 하지만 실제로는 비식별화되지 않았습니다. 경보가 울리지 않습니다. 팀은 작업이 완료된 것으로 판단합니다. 실제로는 그렇지 않습니다.
이것이 가장 위험한 유형의 격차입니다. 아무도 모르는 격차입니다.
세 가지 해결 방법
Presidio에서 코드로 구현. Python 개발 역량과 지속적인 유지보수가 필요합니다. 효과는 있지만 시간이 많이 걸립니다.
수동 검토 추가. 담당자가 각 문서에서 MRN을 직접 확인합니다. 확장이 불가능합니다.
AI 지원 커스텀 엔터티 생성 사용. 코드 불필요. 팀이 샘플 값을 제공하면 AI가 패턴을 생성합니다.
작동 방식은 다음과 같습니다. 팀이 5개의 MRN 샘플 값을 제공합니다: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. AI는 SVHS-\d{7}를 반환하고 샘플에 대조해 검증합니다. 팀은 이를 HIPAA 프리셋에 저장합니다. 이후 모든 세션에서 해당 형식을 자동으로 감지합니다. 수혜자 코드와 기기 일련번호에도 동일한 방식을 적용할 수 있습니다.
프리셋 작동 방식은 HIPAA MRN 탐지 가이드를 참조하십시오. AI 패턴 워크플로도 확인하십시오.
숨겨진 가정
많은 팀이 이름과 전화번호가 포함된 샘플 문서로 테스트합니다. 도구가 통과합니다. 전체 적용 범위가 확보된 것으로 가정합니다. 그러나 샘플에는 기관별 고유 식별자가 포함되는 경우가 드뭅니다. MRN과 수혜자 코드는 범용 도구에 무작위 문자열처럼 보입니다. 아무 표시 없이 통과합니다.
진정한 세이프 하버 감사는 18개 범주 각각에 탐지 방법을 매핑합니다. 8번 범주의 경우, 자신의 병원에서 실제 MRN 샘플로 검증하십시오. 도구가 해당 형식을 알고 있다고 가정하지 마십시오.
전체 프레임워크는 HIPAA 컴플라이언스 개요를 참조하십시오.
결론
세이프 하버는 18개 식별자 범주를 모두 제거할 것을 요구합니다. 범용 도구는 그보다 훨씬 적은 수를 처리합니다. MRN, 수혜자 코드, 기기 일련번호 같은 격차는 표준 형식이 없어 범용 도구가 놓칩니다. AI 지원 커스텀 엔터티는 코드나 수동 검토 없이 이 격차를 해소합니다.
참고 자료
- HHS: HIPAA 세이프 하버, 45 CFR § 164.514 — hhs.gov
- Shaip: 의료 비식별화의 PHI 식별자 유형 — shaip.com
- HHS OCR: 2024년 업데이트 비식별화 지침 — hhs.gov