By · Last updated 2026-04-28

Quay lại BlogChăm Sóc Sức Khỏe

18 định danh HIPAA mà công cụ của bạn bỏ lỡ

HIPAA liệt kê 18 định danh PHI. Hầu hết công cụ ẩn danh hóa chỉ phát hiện khoảng 6 trong số đó. Số Hồ Sơ Y Tế thay đổi theo từng cơ sở mà không có định dạng tiêu chuẩn Mỹ nào.

April 28, 20269 phút đọc
HIPAA 18 identifiersPHI complete detectionMRN detectionNPI DEA numbersHIPAA Safe Harbor compliance

18 Định Danh HIPAA Mà Công Cụ Của Bạn Bỏ Lỡ

Cập nhật cho năm 2026.

HIPAA liệt kê 18 danh mục định danh PHI. Hầu hết công cụ ẩn danh hóa chỉ phát hiện khoảng sáu. Mười hai cái còn lại trượt qua — và mỗi cái là một khoảng trống tuân thủ.

Quy Tắc Safe Harbor

Quy tắc Quyền riêng tư của HIPAA (45 CFR § 164.514) định nghĩa xác định danh tính Safe Harbor. Tất cả 18 danh mục định danh phải được loại bỏ. Loại bỏ tất cả và dữ liệu được xác định danh tính theo luật. Đây là lý do Safe Harbor phổ biến: đó là vượt hoặc không, không phải một phán quyết tùy ý.

18 danh mục là:

  1. Tên
  2. Dữ liệu địa lý nhỏ hơn tiểu bang — địa chỉ đường phố, thành phố, quận, mã ZIP
  3. Ngày ngoại trừ năm — sinh, nhập viện, xuất viện, tử vong
  4. Số điện thoại
  5. Số fax
  6. Địa chỉ email
  7. Số An sinh Xã hội
  8. Định danh hồ sơ y tế (MRN)
  9. Mã người thụ hưởng kế hoạch y tế
  10. Định danh tài khoản
  11. Mã chứng chỉ và giấy phép
  12. Định danh và số serial phương tiện
  13. Định danh và số serial thiết bị
  14. URL web
  15. Địa chỉ IP
  16. Định danh sinh trắc học — dấu vân tay, giọng nói
  17. Ảnh mặt đầy đủ và hình ảnh tương tự
  18. Bất kỳ mã hoặc giá trị nhận dạng duy nhất nào khác

Hầu hết công cụ xử lý danh mục 1, 4, 6 và 7 tốt. Chúng thường xuyên bỏ lỡ 8, 9, 10, 11, 13 và 18.

Khoảng Trống MRN

Định danh hồ sơ y tế nằm ở danh mục 8. Định dạng MRN được đặt bởi từng bệnh viện. Không có tiêu chuẩn quốc gia Mỹ nào.

Bệnh viện A dùng số nguyên 7 chữ số. Bệnh viện B dùng "PT-YYYYNNNN." Bệnh viện C dùng chuỗi chữ và số 8 ký tự. Bệnh viện D viết "MRN: " trước một mã 9 chữ số.

Một công cụ chung sẽ không gắn cờ "PT-2024-8847" là PHI. Tài liệu vượt qua các kiểm tra xác định danh tính. Nhưng nó không được xác định danh tính. Không có cảnh báo nào kích hoạt. Nhóm nghĩ công việc đã xong. Nhưng chưa.

Đây là loại khoảng trống tệ nhất: khoảng trống im lặng.

Ba Cách Để Khắc Phục

Viết mã trong Presidio. Điều này cần kỹ năng Python và bảo trì liên tục. Nó hoạt động nhưng tốn thời gian.

Thêm xem xét thủ công. Một người kiểm tra từng tài liệu để tìm MRN. Điều này không mở rộng được.

Sử dụng tạo thực thể tùy chỉnh được hỗ trợ bởi AI. Không cần mã. Nhóm cung cấp các giá trị mẫu. AI xây dựng mẫu.

Đây là cách hoạt động. Một nhóm cung cấp năm giá trị MRN mẫu: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. AI trả về SVHS-\d{7} và kiểm tra nó với các mẫu. Nhóm lưu nó vào cài đặt sẵn HIPAA của họ. Tất cả các phiên trong tương lai phát hiện định dạng đó. Cách tiếp cận tương tự áp dụng cho mã người thụ hưởng và số serial thiết bị.

Xem cách cài đặt sẵn hoạt động trong hướng dẫn phát hiện MRN HIPAA. Tìm hiểu về quy trình mẫu AI.

Giả Định Ẩn

Nhiều nhóm kiểm tra trên một tài liệu mẫu có tên và số điện thoại. Công cụ vượt qua. Họ giả định bao phủ đầy đủ. Nhưng các mẫu hiếm khi bao gồm các định danh dành riêng cho cơ sở. MRN và mã người thụ hưởng trông như các chuỗi ngẫu nhiên đối với công cụ chung. Chúng vượt qua mà không có cờ.

Một cuộc kiểm tra Safe Harbor thực sự ánh xạ tất cả 18 danh mục đến một phương pháp phát hiện. Đối với danh mục 8, hãy xác minh với các mẫu MRN thực tế từ bệnh viện của riêng bạn. Đừng giả định công cụ biết định dạng của bạn.

Xem xét toàn bộ khung trong tổng quan tuân thủ HIPAA.

Kết Luận

Safe Harbor yêu cầu tất cả 18 danh mục định danh phải được loại bỏ. Các công cụ chung bao phủ ít hơn nhiều. Các khoảng trống — MRN, mã người thụ hưởng, số serial thiết bị — không có định dạng tiêu chuẩn, nên công cụ chung bỏ lỡ chúng. Các thực thể tùy chỉnh được hỗ trợ bởi AI đóng khoảng trống mà không cần mã hoặc xem xét thủ công.

Nguồn Tài Liệu

  • HHS: HIPAA Safe Harbor, 45 CFR § 164.514 — hhs.gov. VERIFIED.
  • Shaip: Các loại định danh PHI trong xác định danh tính y tế — shaip.com. VERIFIED-EXTERNAL.
  • HHS OCR: Hướng dẫn xác định danh tính cập nhật 2024 — hhs.gov. VERIFIED.

Sẵn sàng bảo vệ dữ liệu của bạn?

Bắt đầu ẩn danh PII với 285+ loại thực thể trên 48 ngôn ngữ.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.