MRN 형식 문제
미국에는 약 6,100개의 병원이 있습니다. 각 병원은 자체 EHR 시스템을 운영합니다. 각 병원은 고유한 의료 기록 번호(MRN) 형식을 사용합니다. 국가 표준이 없습니다. 합동위원회(Joint Commission)는 병원이 환자를 식별할 수 있을 것을 요구하지만 형식 규칙은 정하지 않습니다.
형식은 매우 다양합니다. 7자리 정수를 사용하는 곳이 있습니다. 8자리 정수를 사용하는 곳도 있습니다. HOSP-, MRN-, PT- 같은 접두사 코드를 사용하는 곳도 있습니다. SVHS-, CHOP- 같은 기관 코드를 추가하는 곳도 있습니다. 번호에 입원 연도를 포함하는 경우도 있습니다.
HIPAA 세이프 하버는 환자 기록 번호를 18개 식별자 유형 중 8번으로 규정합니다(45 CFR §164.514(b)(2)). 18개를 모두 제거해야 합니다. 이 규칙은 특정 형식에만 적용되지 않습니다. 병원이 커스텀 형식을 사용한다면 그것도 탐지해야 합니다. 이를 놓치는 도구는 나머지 17개를 모두 제거하더라도 세이프 하버를 충족하지 못합니다.
코드 방식의 한계
비식별화 파이프라인에 커스텀 기록 번호 형식을 추가하는 표준 방법은 Microsoft Presidio를 확장하는 것입니다. 이는 Python 코딩을 의미합니다.
개발자는 EntityRecognizer를 확장하는 클래스를 만들고, 정규식을 작성하고, Presidio 레지스트리에 연결하고, 테스트하고, 유지보수해야 합니다. 코딩을 거의 하지 않는 컴플라이언스 팀에게 이는 심각한 장벽입니다. 형식이 바뀔 때마다 엔지니어가 필요합니다.
의료 엔지니어는 바쁩니다. EHR 통합과 임상 시스템에 집중합니다. 컴플라이언스 도구는 최우선 순위가 아닌 경우가 많습니다.
코드 없는 패턴 워크플로
가이드 기반 패턴 방식은 코딩 단계를 없앱니다.
컴플라이언스 담당자가 웹 앱의 커스텀 엔터티 생성기를 열고, 자신의 시스템에서 샘플 번호 5개를 붙여넣습니다. 예시:
SVHS-0012345
SVHS-0987654
SVHS-1122334
SVHS-4455667
SVHS-8899001
패턴 생성 버튼을 클릭합니다. AI가 구조를 읽고 다음을 반환합니다:
- 패턴:
SVHS-\d{7} - 신뢰도: 높음
- 제안 이름:
HOSPITAL-MRN - 제안 대체값:
[MRN]
담당자가 샘플 5개를 더 붙여넣습니다. 패턴이 통과합니다. HIPAA 프리셋에 저장합니다.
이후부터는 모든 세션 — 웹 앱, Office 추가 기능, 데스크톱 앱, API — 이 표준 PHI 처리 과정에서 이 형식을 자동으로 탐지합니다. 코드가 필요 없습니다.
GDPR 연구 참고사항
GDPR 제89조는 연구 데이터셋에 대한 가명 처리를 요구합니다. 커스텀 엔터티는 기관별 고유 식별자를 적용 범위에 포함시켜, 범용 도구가 남겨두는 격차를 해소합니다.
결과
이 워크플로는 반나절이면 충분합니다. 커스텀 코드로 구현하면 몇 주가 걸립니다.
컴플라이언스 담당자가 패턴을 정의하고, 테스트하고, 배포합니다. 티켓도, 대기도 필요 없습니다. 프리셋에는 커스텀 엔터티와 함께 표준 17개 세이프 하버 식별자가 모두 포함됩니다.
다음 번 임상 기록 배치 처리 시, 18개 식별자 유형이 모두 처리됩니다. 세이프 하버가 완성됩니다.
실제 세이프 하버 운영 방식은 의료 연구를 위한 HIPAA 세이프 하버 비식별화를 참조하십시오. 병원별 탐지 패턴은 엔지니어링 없이 병원별 MRN 형식 탐지를 참조하십시오.