By · Last updated 2026-05-30

블로그로 돌아가기의료

HIPAA: 병원별 의무기록번호(MRN) 탐지

HIPAA 세이프 하버는 의무기록번호 제거를 요구하지만 MRN 형식은 표준화되어 있지 않습니다. Epic, Cerner, Meditech 모두 다른 형식을 사용하며, 일반 PII 도구는 이를 놓칩니다.

May 30, 20267 분 읽기
HIPAA Safe Harbormedical record numbersMRN detectionhealthcare compliancecustom PII patterns

2026년 업데이트

HIPAA 세이프 하버 비식별화: 엔지니어링 없이 병원별 MRN 형식 탐지

HIPAA 세이프 하버는 의무기록번호 제거를 요구합니다. 이것은 18가지 필수 ID 유형 중 하나입니다. 간단하게 들립니다. 문제는 MRN 형식이 표준화되어 있지 않다는 것입니다.

Epic은 하나의 형식을 사용합니다. Cerner는 다른 형식을 사용합니다. Meditech는 또 다른 형식을 사용합니다. 각 병원은 자체 코드를 추가합니다. 지역 의료 그룹은 더 많은 형식을 만들어냅니다. 표준 PII 도구는 귀하의 형식을 알 수 없습니다. 귀하의 MRN을 놓칠 것입니다.

이것은 사소한 위험이 아닙니다. 의료 IT 팀은 비식별화 의도로 처리된 데이터셋에서 여전히 MRN을 발견하는 경우가 많습니다. 도구가 일반 PII 유형에만 설정되어 있었기 때문입니다.

MRN 형식 문제

미국에는 의무기록번호에 대한 국가 표준이 없습니다. 각 병원 또는 EHR 벤더가 자체 형식을 정의합니다.

관찰된 일반적인 패턴:

  • Epic 방식: 8~12자리 숫자 (예: 123456789)
  • Cerner 방식: 병원 코드 접두어 + 숫자 (예: MGH-987654)
  • 지역 네트워크: 시설 코드 + 연도 + 일련번호 (예: HOSP-2023-456789)
  • 재향군인부: 검사 자릿수가 있는 9자리
  • 소아과 시스템: 환자 유형 접두어 + 숫자 (예: PED-12345678)

단일 규칙으로 이 모두를 매칭할 수 없습니다. 보편적인 MRN 패턴은 없습니다.

표준 PII 도구가 탐지하는 것: 대부분의 HIPAA 도구는 고정 형식 ID에 집중합니다. 사회보장번호는 XXX-XX-XXXX를 따릅니다. 전화번호는 XXX-XXX-XXXX를 따릅니다. 이메일 주소는 명확한 형태를 가집니다. 이것들은 찾기 쉽습니다.

MRN, 계좌번호, 면허번호는 HIPAA 8번, 10번, 11번 유형입니다. 이것들은 병원마다 다릅니다. 커스텀 설정이 필요합니다. 일반 도구는 이것들을 탐지하지 않습니다.

컴플라이언스 격차

지역 병원이 대학교 연구 파트너와 환자 데이터를 공유하려고 합니다. 병원의 EHR은 이 MRN 형식을 사용합니다: HOSP-YYYY-XXXXXX.

HIPAA 도구로 데이터를 처리합니다. 도구는 이름, 날짜, 전화번호, 사회보장번호를 제거합니다. MRN은 제거하지 않습니다. HOSP-2023-456789는 내장된 규칙과 매칭되지 않습니다.

연구자가 데이터셋을 받습니다. 같은 병원의 이전 의뢰에서 MRN이 포함된 자체 기록과 조인합니다. 많은 환자를 재식별할 수 있게 됩니다. 병원은 HIPAA 위반을 저질렀습니다.

이것은 실제로 발생하는 실패 유형입니다. 세이프 하버가 무너지는 곳에 대한 자세한 내용은 의료 연구를 위한 HIPAA 세이프 하버 비식별화를 참조하세요.

해결책: 커스텀 엔티티 생성

해결책은 귀하의 MRN 형식을 커스텀 엔티티로 정의하는 것입니다. 컴플라이언스 담당자가 할 수 있습니다. 엔지니어가 필요하지 않습니다.

단계:

  1. 형식을 기록합니다: "HOSP로 시작하고, 대시, 4자리 연도, 대시, 6자리 숫자"

  2. AI 도구를 사용하여 정규표현식 구축: HOSP-\d{4}-\d{6}

  3. 퇴원 요약 20건에서 테스트합니다. 모든 MRN이 탐지되는지 확인합니다.

  4. "Hospital MRN"이라는 커스텀 엔티티로 저장합니다

  5. 표준 17가지 ID 유형과 함께 HIPAA 프리셋에 추가합니다

이 과정은 컴플라이언스 담당자에게 약 3일이 걸립니다. 커스텀 코드 구축은 3개월이 걸릴 수 있습니다.

예시: 15개 시설 병원 네트워크

조직: 15개 시설의 지역 병원 네트워크

MRN 형식: HOSP-YYYY-XXXXXX (수천 건의 퇴원 요약 PDF에 포함)

목표: HIPAA 데이터 사용 계약 하에 대학교 파트너와 연구 데이터셋 공유

기존 방식: 연 12만 달러의 외부 비식별화 벤더

발견된 격차: 벤더 도구가 기관별 MRN 형식을 탐지하지 않음

새 워크플로:

  1. 컴플라이언스 담당자가 MRN 패턴 정의 — 20분
  2. AI가 정규표현식 검증 — 5분
  3. 샘플 요약 50건에서 테스트 — 30분
  4. MRN 없음, 오탐 없음 확인 — 10분
  5. HIPAA 프리셋에 커스텀 엔티티 추가
  6. 전체 5만 건 데이터셋을 배치로 실행

격차 해소 총 소요 시간: 오후 한나절.

다중 시설 네트워크: 여러 MRN 형식

합병을 통해 구축된 병원 네트워크는 종종 여러 EHR 시스템을 운영합니다. 각 레거시 시스템이 다른 MRN 형식을 사용할 수 있습니다.

처리 방법:

각 형식에 대해 별도의 커스텀 엔티티를 만듭니다:

  • "MRN 형식 A (Epic)" — 8자리 숫자
  • "MRN 형식 B (레거시 Cerner)" — 접두어 + 7자리 숫자
  • "MRN 형식 C (인수된 계열사)" — 주 코드 + 연도 + 일련번호

하나의 프리셋이 세 가지 커스텀 엔티티와 표준 HIPAA ID 유형을 모두 담고 있습니다. 모든 시설의 모든 문서에서 MRN이 제거됩니다.

이 다중 형식 설정에 대한 단계별 가이드는 코드 없이 HIPAA 파이프라인에서 커스텀 MRN 탐지를 참조하세요.

MRN 이상: 기타 비표준 식별자

동일한 접근 방식이 다른 HIPAA 세이프 하버 ID 유형에도 적용됩니다.

건강보험 회원 번호 (9번 범주): 각 보험사가 자체 형식을 사용합니다. Aetna, Blue Cross, United Healthcare 모두 다르게 보입니다. 청구 팀은 각 보험사에 대한 커스텀 패턴이 필요합니다.

계좌번호 (10번 범주): 병원 청구 계좌번호는 병원마다 다릅니다.

면허번호 (11번 범주): DEA 번호는 표준 연방 형식을 가집니다. 주 의료 면허번호는 그렇지 않습니다. 각 주 위원회가 자체 형식을 사용합니다.

기기 식별자 (14번 범주): 의료 기기 일련번호는 각 제조사가 설정합니다.

각각에 대해 커스텀 엔티티가 격차를 해소합니다. 엔지니어가 필요하지 않습니다.

비표준 ID 유형에 대한 자세한 내용은 조직 익명화를 위한 커스텀 PII 식별자를 참조하세요.

검증: 세이프 하버 컴플라이언스 증명

HIPAA 세이프 하버는 보호 주체가 데이터가 누군가를 식별할 수 있다는 "실제 지식"이 없어야 한다고 명시합니다. (45 CFR §164.514(b)(1))

커스텀 엔티티 검증으로 18가지 ID 유형이 모두 커버됨을 증명합니다.

검증 단계:

  1. 연구 데이터셋에서 50~100건의 샘플 문서 처리
  2. 결과 검토 — ID처럼 보이는 것이 있나요?
  3. 놓친 항목을 탐지하기 위해 두 번째 탐지 패스 실행
  4. 수행한 작업 문서화

커스텀 엔티티 설정, 샘플 검토, 처리 로그가 귀하의 세이프 하버 기록을 형성합니다.

결론

기본 설정의 표준 PII 도구는 HIPAA 세이프 하버 비식별화를 완성하지 못합니다. 의무기록번호는 병원별로 다릅니다. 커스텀 탐지가 필요합니다.

커스텀 엔티티 생성이 이 격차를 몇 시간 만에 해소합니다. 컴플라이언스 담당자가 패턴을 정의하고, 테스트하고, 데이터를 처리할 수 있습니다. 엔지니어링 작업이 필요하지 않습니다.

"HIPAA 도구를 실행했다"와 "18가지 세이프 하버 식별자를 모두 제거했다" 사이의 격차는 종종 단 하나의 누락된 커스텀 엔티티입니다.

출처

데이터 보호를 시작할 준비가 되셨나요?

48개 언어로 285개 이상의 엔티티 유형으로 PII 익명화를 시작하세요.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.