By · Last updated 2026-06-03

Quay lại BlogChăm Sóc Sức Khỏe

Phát Hiện MRN Theo HIPAA Không Cần Chuyên Gia Regex

Mỗi bệnh viện có định dạng MRN riêng. Memorial dùng MRN:XXXXXXX, St. Mary's dùng PT-YYYYY, University Hospital dùng UHN-XXXXXXXXXX.

June 3, 20266 phút đọc
HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

Phát Hiện MRN Theo HIPAA Không Cần Chuyên Gia Regex

Định dạng MRN của bệnh viện bạn không có trong bất kỳ công cụ PII tiêu chuẩn nào. Đây là cách thêm vào trong năm phút. Không cần viết code.

Các nhóm CNTT y tế đối mặt với vấn đề HIPAA mà các ngành khác không gặp phải. Mã định danh họ cần tìm kiếm nhất — Số Hồ Sơ Bệnh Nhân (MRN) — do chính bệnh viện của họ quy định. Không có tiêu chuẩn quốc gia nào tồn tại.

Mọi dự án xóa nhận dạng HIPAA đều cần thiết lập tùy chỉnh. Nếu không có, MRN sẽ lọt qua các tệp được "xóa nhận dạng" mà không bị phát hiện.

Vấn Đề MRN Đa Cơ Sở

Các mạng lưới bệnh viện được xây dựng qua sáp nhập có hệ thống HER cũ. Mỗi hệ thống có định dạng MRN riêng:

  • Memorial Hospital (Epic): MRN:XXXXXXX — số 7 chữ số với tiền tố
  • St. Mary's (Cerner): PT-YYYYY — 5 chữ số với tiền tố bệnh nhân
  • University Hospital (Meditech): UHN-XXXXXXXXXX — chuỗi 10 ký tự hỗn hợp
  • Phòng khám (EMR độc lập): C\d{5} — chữ C cộng 5 chữ số

HIPAA Safe Harbor yêu cầu xóa tất cả 18 loại mã định danh. Danh mục 8 là số hồ sơ bệnh nhân. Công cụ không biết định dạng của bạn sẽ bỏ sót chúng. Tệp trông có vẻ sạch nhưng thực tế không phải vậy.

Cộng đồng ServiceNow chăm sóc sức khỏe đã ghi nhận vấn đề chính xác này. Các công cụ tiêu chuẩn phát hiện số an sinh xã hội và số điện thoại. Chúng luôn bỏ sót MRN của từng cơ sở.

Rào Cản Regex

Thêm quy tắc tùy chỉnh vào Microsoft Presidio — cơ sở mã nguồn mở cho nhiều công cụ HIPAA — đòi hỏi kỹ năng thực sự:

  • Bạn cần biết lớp PatternRecognizer
  • Bạn phải viết regex theo cú pháp Python
  • Bạn phải thiết lập file cấu hình YAML
  • Bạn phải điều chỉnh điểm tin cậy
  • Bạn phải kiểm tra và debug script Python

Một nhân viên tuân thủ biết định dạng MRN không thể tự làm điều này. Việc sửa lỗi kết thúc thành ticket kỹ thuật. Nó nằm trong hàng đợi 6–8 tuần. Lỗ hổng vẫn còn đó.

Tạo Mẫu Bằng AI

Có cách nhanh hơn. Mô tả mẫu bằng ngôn ngữ thông thường. Nhận lại regex hoạt động được.

Các bước:

  1. Mở công cụ xây dựng thực thể tùy chỉnh
  2. Cung cấp ví dụ: "MRN của chúng tôi trông như thế này: MRN:1234567, MRN:9876543, MRN:0001234"
  3. AI xây dựng quy tắc: MRN:\d{7}
  4. Kiểm tra trên 10 hồ sơ mẫu
  5. Tìm thấy tất cả MRN? Lưu và triển khai.

Đối với mạng lưới có bốn định dạng MRN:

  • Memorial Hospital → MRN:\d{7}
  • St. Mary's → PT-\d{5}
  • University Hospital → UHN-[A-Z0-9]{10}
  • Phòng khám → C\d{5}

Tạo bốn thực thể tùy chỉnh. Nhóm chúng vào một preset. Chạy trên tất cả các tệp. Thời gian: một buổi chiều.

Xem phát hiện MRN tùy chỉnh trong pipeline HIPAA không cần code để có hướng dẫn đầy đủ.

Xác Thực Cho Safe Harbor

HIPAA Safe Harbor quy định thực thể được bảo vệ không được có "kiến thức thực tế" rằng dữ liệu có thể nhận dạng được ai đó. (45 CFR §164.514(b))

Xác thực cho thấy các quy tắc tùy chỉnh của bạn bao phủ tất cả 18 loại mã định danh.

Bước 1: Lấy mẫu. Lấy 100 hồ sơ từ mỗi cơ sở. Kết hợp nhiều khoảng thời gian và phòng ban.

Bước 2: Chạy phát hiện. Xử lý tất cả 400 tài liệu với các quy tắc tùy chỉnh của bạn.

Bước 3: Kiểm tra thủ công. Xem xét 20 tài liệu bằng tay (mẫu 5%). Tìm MRN bị bỏ sót và kết quả dương tính giả.

Bước 4: Tinh chỉnh quy tắc. Bỏ sót MRN? Mở rộng mẫu. Quá nhiều kết quả dương tính giả? Thêm ranh giới từ.

Bước 5: Ghi chép. Ghi lại quy tắc, kích thước mẫu, kết quả và ngày tháng. Nhật ký này là bằng chứng Safe Harbor của bạn.

Xem biên tập có thể giải thích được và nhật ký kiểm toán HIPAA để biết thêm về những gì cần ghi lại.

Phạm Vi Bao Phủ Đầy Đủ Safe Harbor

Sau khi sửa phát hiện MRN, kiểm tra tất cả 18 danh mục.

Danh MụcCông Cụ Tiêu ChuẩnCần Tùy Chỉnh?
1. TênMô hình NERKhông
2. Dữ liệu địa lýPhát hiện vị tríKhông cho tiểu bang; Có cho mã cơ sở
3. Ngày thángPhát hiện ngàyKhông
4. Số điện thoạiPhát hiện điện thoạiKhông
5. Số faxPhát hiện điện thoạiKhông
6. Địa chỉ emailPhát hiện emailKhông
7. Số an sinh xã hộiPhát hiện SSNKhông
8. Số hồ sơ bệnh nhânKhông có sẵnCó — theo cơ sở
9. Số thành viên kế hoạch sức khỏeMột phầnThường có — theo bên thanh toán
10. Số tài khoảnMột phầnThường có — định dạng thanh toán
11. Số giấy phépMột phầnThường có — theo tiểu bang
12. Mã phương tiệnMột phầnHiếm trong tài liệu lâm sàng
13. Mã thiết bịMột phầnCó nếu thiết bị trong hồ sơ
14. URL webPhát hiện URLKhông
15. Địa chỉ IPPhát hiện IPKhông
16. Mã sinh trắc họcNgữ cảnh văn bảnHiếm trong ghi chú xuất viện
17. ẢnhChỉ hình ảnhNgoài phạm vi văn bản
18. Mã định danh duy nhất khácKhông có sẵnCó — theo cơ sở

Đối với văn bản lâm sàng, các danh mục 8, 9, 10 và 18 thường xuyên cần thiết lập tùy chỉnh nhất.

Ngữ Cảnh Tài Liệu Lâm Sàng

Ghi chú xuất viện, ghi chú lâm sàng và báo cáo phẫu thuật là các tệp chính được chia sẻ cho nghiên cứu. Chúng chứa:

  • MRN ở đầu và cuối trang
  • Số tài khoản trong phần thanh toán
  • Ngày cho tất cả các sự kiện — nhập viện, thủ thuật, xét nghiệm, thuốc
  • Tên bác sĩ và số DEA
  • Thông tin bác sĩ giới thiệu
  • Mã thành viên bảo hiểm

Các quy tắc tùy chỉnh cho định dạng đặc thù theo cơ sở kết hợp với quy tắc tích hợp cho định dạng tiêu chuẩn. Sự kết hợp đó cho bạn phạm vi bao phủ đầy đủ Safe Harbor.

Kết Luận

Xóa nhận dạng HIPAA mà không có quy tắc tùy chỉnh không phải là xóa nhận dạng Safe Harbor. Định dạng MRN của mỗi bệnh viện là duy nhất. Các công cụ tiêu chuẩn bỏ sót chúng. Lỗ hổng tuân thủ là thực tế và nó vẫn còn đó cho đến khi bạn đóng nó lại.

Tạo mẫu bằng AI rút ngắn thời gian sửa lỗi từ 6–8 tuần kỹ thuật xuống còn một buổi chiều làm việc tuân thủ. Mô tả định dạng. Kiểm tra trên hồ sơ thực. Triển khai. Xong.

Nguồn Tham Khảo

Sẵn sàng bảo vệ dữ liệu của bạn?

Bắt đầu ẩn danh PII với 285+ loại thực thể trên 48 ngôn ngữ.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.