By · Last updated 2026-04-28

블로그로 돌아가기의료

당신의 도구가 놓치는 HIPAA 18개 식별자

HIPAA는 18개의 PHI 식별자 유형을 규정합니다. 대부분의 익명화 도구는 6개 정도만 감지합니다. 의료 기록 번호(MRN)는 기관마다 형식이 다르며 미국 표준이 없습니다.

April 28, 20269 분 읽기
HIPAA 18 identifiersPHI complete detectionMRN detectionNPI DEA numbersHIPAA Safe Harbor compliance

당신의 도구가 놓치는 HIPAA 18개 식별자

2026년 기준으로 업데이트됨.

HIPAA는 18개의 PHI 식별자 범주를 규정합니다. 대부분의 익명화 도구는 6개 정도만 감지합니다. 나머지 12개는 통과되며, 이는 각각 컴플라이언스 위반으로 이어집니다.

세이프 하버 규칙

HIPAA 개인정보 보호 규칙(45 CFR § 164.514)은 세이프 하버 비식별화를 정의합니다. 18개 식별자 범주를 모두 제거해야 합니다. 전부 제거하면 법적으로 비식별화된 데이터로 인정됩니다. 세이프 하버가 널리 사용되는 이유가 바로 이것입니다. 통과 또는 실패, 판단의 여지가 없습니다.

18개 범주는 다음과 같습니다:

  1. 이름
  2. 주보다 작은 단위의 지리 데이터 — 주소, 시, 군, 우편번호
  3. 연도를 제외한 날짜 — 출생일, 입원일, 퇴원일, 사망일
  4. 전화번호
  5. 팩스번호
  6. 이메일 주소
  7. 사회보장번호
  8. 의료 기록 식별자(MRN)
  9. 건강보험 수혜자 코드
  10. 계정 식별자
  11. 자격증 및 면허 코드
  12. 차량 식별자 및 일련번호
  13. 기기 식별자 및 일련번호
  14. 웹 URL
  15. IP 주소
  16. 생체 식별자 — 지문, 음성 패턴
  17. 전체 얼굴 사진 및 유사 이미지
  18. 기타 고유 식별 코드 또는 값

대부분의 도구는 1번, 4번, 6번, 7번 범주를 잘 처리합니다. 8번, 9번, 10번, 11번, 13번, 18번은 일상적으로 놓칩니다.

MRN 탐지 격차

의료 기록 식별자는 8번 범주에 해당합니다. MRN 형식은 각 병원이 자체적으로 정합니다. 미국에는 표준 형식이 없습니다.

A 병원은 7자리 정수를 사용합니다. B 병원은 "PT-YYYYNNNN" 형식을 씁니다. C 병원은 8자리 영숫자 문자열을 사용합니다. D 병원은 9자리 코드 앞에 "MRN: "을 붙여 씁니다.

범용 도구는 "PT-2024-8847"을 PHI로 식별하지 않습니다. 문서는 비식별화 검사를 통과합니다. 하지만 실제로는 비식별화되지 않았습니다. 경보가 울리지 않습니다. 팀은 작업이 완료된 것으로 판단합니다. 실제로는 그렇지 않습니다.

이것이 가장 위험한 유형의 격차입니다. 아무도 모르는 격차입니다.

세 가지 해결 방법

Presidio에서 코드로 구현. Python 개발 역량과 지속적인 유지보수가 필요합니다. 효과는 있지만 시간이 많이 걸립니다.

수동 검토 추가. 담당자가 각 문서에서 MRN을 직접 확인합니다. 확장이 불가능합니다.

AI 지원 커스텀 엔터티 생성 사용. 코드 불필요. 팀이 샘플 값을 제공하면 AI가 패턴을 생성합니다.

작동 방식은 다음과 같습니다. 팀이 5개의 MRN 샘플 값을 제공합니다: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. AI는 SVHS-\d{7}를 반환하고 샘플에 대조해 검증합니다. 팀은 이를 HIPAA 프리셋에 저장합니다. 이후 모든 세션에서 해당 형식을 자동으로 감지합니다. 수혜자 코드와 기기 일련번호에도 동일한 방식을 적용할 수 있습니다.

프리셋 작동 방식은 HIPAA MRN 탐지 가이드를 참조하십시오. AI 패턴 워크플로도 확인하십시오.

숨겨진 가정

많은 팀이 이름과 전화번호가 포함된 샘플 문서로 테스트합니다. 도구가 통과합니다. 전체 적용 범위가 확보된 것으로 가정합니다. 그러나 샘플에는 기관별 고유 식별자가 포함되는 경우가 드뭅니다. MRN과 수혜자 코드는 범용 도구에 무작위 문자열처럼 보입니다. 아무 표시 없이 통과합니다.

진정한 세이프 하버 감사는 18개 범주 각각에 탐지 방법을 매핑합니다. 8번 범주의 경우, 자신의 병원에서 실제 MRN 샘플로 검증하십시오. 도구가 해당 형식을 알고 있다고 가정하지 마십시오.

전체 프레임워크는 HIPAA 컴플라이언스 개요를 참조하십시오.

결론

세이프 하버는 18개 식별자 범주를 모두 제거할 것을 요구합니다. 범용 도구는 그보다 훨씬 적은 수를 처리합니다. MRN, 수혜자 코드, 기기 일련번호 같은 격차는 표준 형식이 없어 범용 도구가 놓칩니다. AI 지원 커스텀 엔터티는 코드나 수동 검토 없이 이 격차를 해소합니다.

참고 자료

  • HHS: HIPAA 세이프 하버, 45 CFR § 164.514 — hhs.gov
  • Shaip: 의료 비식별화의 PHI 식별자 유형 — shaip.com
  • HHS OCR: 2024년 업데이트 비식별화 지침 — hhs.gov

데이터 보호를 시작할 준비가 되셨나요?

48개 언어로 285개 이상의 엔티티 유형으로 PII 익명화를 시작하세요.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.