By · Last updated 2026-06-04

بازگشت به وبلاگبهداشت و درمان

شناسایی MRN در HIPAA بدون نیاز به تخصص regex

فرمت MRN هر بیمارستان متفاوت است. Memorial از MRN:XXXXXXX، St. Mary's از PT-YYYYY و University Hospital از UHN-XXXXXXXXXX استفاده می‌کند.

June 4, 20266 دقیقه مطالعه
HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

شناسایی MRN در HIPAA بدون نیاز به تخصص regex

فرمت MRN بیمارستان شما در هیچ ابزار استاندارد PII وجود ندارد. در اینجا نحوه افزودن آن در پنج دقیقه آمده است. بدون نیاز به کد.

تیم‌های IT بهداشت و درمان با یک مشکل HIPAA روبرو هستند که سایر بخش‌ها ندارند. شناسه‌ای که بیشترین نیاز به یافتن آن دارند — شماره پرونده پزشکی — توسط بیمارستان خودشان تعیین می‌شود. هیچ استاندارد ملی وجود ندارد.

هر پروژه حذف شناسه در HIPAA نیاز به تنظیم سفارشی دارد. بدون آن، MRN‌ها از فایل‌های «حذف‌شناسه‌شده» بدون شناسایی عبور می‌کنند.

مشکل MRN در چند مرکز

شبکه‌های بیمارستانی ساخته‌شده از طریق ادغام، سیستم‌های EHR قدیمی دارند. هر سیستم فرمت MRN خود را دارد:

  • بیمارستان Memorial (Epic): MRN:XXXXXXX — عدد ۷ رقمی با پیشوند
  • St. Mary's (Cerner): PT-YYYYY — ۵ رقم با پیشوند بیمار
  • University Hospital (Meditech): UHN-XXXXXXXXXX — ترکیب ۱۰ کاراکتری
  • کلینیک (EMR مستقل): C\d{5} — حرف C به علاوه ۵ رقم

حذف امن HIPAA نیاز به حذف همه ۱۸ نوع شناسه دارد. دسته ۸ شماره‌های پرونده پزشکی است. ابزاری که فرمت شما را نمی‌شناسد آن‌ها را از دست می‌دهد. فایل تمیز به نظر می‌رسد. اما نیست.

جامعه ServiceNow در بهداشت و درمان این مشکل دقیق را مطرح کرده است. ابزارهای استاندارد SSN‌ها و شماره تلفن‌ها را شناسایی می‌کنند. اما MRN‌های تسهیلات را هر بار از دست می‌دهند.

مانع regex

افزودن قوانین سفارشی به Microsoft Presidio — پایه متن‌باز بسیاری از ابزارهای HIPAA — نیاز به مهارت واقعی دارد:

  • باید کلاس PatternRecognizer را بشناسید
  • باید regex در نحو Python بنویسید
  • باید فایل‌های پیکربندی YAML راه‌اندازی کنید
  • باید امتیازات اطمینان را تنظیم کنید
  • باید اسکریپت‌های Python را آزمایش و اشکال‌زدایی کنید

یک افسر انطباق که فرمت MRN را می‌شناسد نمی‌تواند این کار را به تنهایی انجام دهد. رفع مشکل به صورت یک تیکت مهندسی درمی‌آید. ۶ تا ۸ هفته در صف می‌نشیند. شکاف باز می‌ماند.

تولید الگو با کمک هوش مصنوعی

راه سریع‌تری وجود دارد. الگو را به زبان ساده توصیف کنید. یک regex کارآمد دریافت کنید.

مراحل:

  1. سازنده موجودیت سفارشی را باز کنید
  2. مثال‌ها بدهید: «MRN‌های ما اینطور هستند: MRN:1234567، MRN:9876543، MRN:0001234»
  3. هوش مصنوعی قانون را می‌سازد: MRN:\d{7}
  4. روی ۱۰ رکورد نمونه آزمایش کنید
  5. همه MRN‌ها پیدا شدند؟ ذخیره کنید و راه‌اندازی کنید.

برای یک شبکه با چهار فرمت MRN:

  • بیمارستان Memorial → MRN:\d{7}
  • St. Mary's → PT-\d{5}
  • University Hospital → UHN-[A-Z0-9]{10}
  • کلینیک → C\d{5}

چهار موجودیت سفارشی بسازید. آن‌ها را در یک پیش‌تنظیم گروه‌بندی کنید. روی همه فایل‌ها اجرا کنید. زمان: یک بعدازظهر.

برای راهنمای کامل، به شناسایی MRN سفارشی در خطوط لوله HIPAA بدون کد مراجعه کنید.

اعتبارسنجی برای حذف امن

حذف امن HIPAA می‌گوید نهاد تحت پوشش نباید «دانش واقعی» داشته باشد که داده‌ها می‌توانند شخصی را شناسایی کنند. (۴۵ CFR §164.514(b))

اعتبارسنجی نشان می‌دهد قوانین سفارشی شما همه ۱۸ نوع شناسه را پوشش می‌دهد.

گام ۱: نمونه‌ها را دریافت کنید. ۱۰۰ رکورد از هر سایت بگیرید. دوره‌های زمانی و بخش‌ها را ترکیب کنید.

گام ۲: شناسایی را اجرا کنید. همه ۴۰۰ سند را با قوانین سفارشی خود پردازش کنید.

گام ۳: بررسی انسانی. ۲۰ سند را به صورت دستی بررسی کنید (نمونه ۵%). به دنبال MRN‌های از دست رفته و برخوردهای نادرست باشید.

گام ۴: قوانین را اصلاح کنید. MRN‌های از دست رفته؟ الگو را گسترش دهید. برخوردهای نادرست زیاد؟ مرزهای کلمه اضافه کنید.

گام ۵: مستند کنید. قانون، اندازه نمونه، نتایج و تاریخ را ثبت کنید. این ثبت سند حذف امن شما است.

برای اطلاعات بیشتر درباره آنچه باید مستند شود، به ویرایش قابل توضیح و مسیرهای حسابرسی HIPAA مراجعه کنید.

پوشش کامل حذف امن

پس از رفع شناسایی MRN، همه ۱۸ دسته را بررسی کنید.

دستهابزارهای استانداردنیاز به سفارشی؟
۱. نام‌هامدل NERخیر
۲. داده‌های جغرافیاییشناسایی مکانخیر برای ایالت؛ بله برای کدهای سایت
۳. تاریخ‌هاشناسایی تاریخخیر
۴. شماره تلفنشناسایی تلفنخیر
۵. شماره فکسشناسایی تلفنخیر
۶. آدرس ایمیلشناسایی ایمیلخیر
۷. SSNشناسایی SSNخیر
۸. شماره‌های پرونده پزشکیدر دسترس نیستبله — مخصوص سایت
۹. شماره‌های عضو طرح بهداشتجزئیاغلب بله — مخصوص پرداخت‌کننده
۱۰. شماره‌های حسابجزئیاغلب بله — فرمت صورتحساب
۱۱. شماره‌های مجوزجزئیاغلب بله — مخصوص ایالت
۱۲. شناسه‌های وسایل نقلیهجزئینادر در اسناد بالینی
۱۳. شناسه‌های دستگاهجزئیبله اگر دستگاه‌ها در سوابق باشند
۱۴. URL‌های وبشناسایی URLخیر
۱۵. آدرس‌های IPشناسایی IPخیر
۱۶. شناسه‌های بیومتریکبافت متننادر در یادداشت‌های ترخیص
۱۷. عکس‌هافقط تصویرخارج از دامنه برای متن
۱۸. سایر شناسه‌های منحصربه‌فرددر دسترس نیستبله — مخصوص سایت

برای متن بالینی، دسته‌های ۸، ۹، ۱۰ و ۱۸ اغلب نیاز به تنظیم سفارشی دارند.

بافت اسناد بالینی

یادداشت‌های ترخیص، یادداشت‌های بالینی و گزارش‌های عمل اصلی‌ترین فایل‌هایی هستند که برای تحقیق به اشتراک گذاشته می‌شوند. آن‌ها حاوی موارد زیر هستند:

  • MRN‌ها در سربرگ‌ها و پاورقی‌ها
  • شماره‌های حساب در بخش‌های صورتحساب
  • تاریخ‌ها برای همه رویدادها — پذیرش، عمل، آزمایشگاه، دارو
  • نام پزشکان و شماره DEA
  • اطلاعات پزشک ارجاع‌دهنده
  • شناسه‌های عضو بیمه

قوانین سفارشی برای فرمت‌های مخصوص سایت با قوانین داخلی برای فرمت‌های استاندارد جفت می‌شوند. این جفت پوشش کامل حذف امن را می‌دهد.

نتیجه‌گیری

حذف شناسه HIPAA بدون قوانین سفارشی، حذف امن نیست. فرمت MRN هر بیمارستان منحصربه‌فرد است. ابزارهای استاندارد آن‌ها را از دست می‌دهند. شکاف انطباق واقعی است و تا زمانی که آن را ببندید باز می‌ماند.

تولید الگو با کمک هوش مصنوعی رفع مشکل را از ۶ تا ۸ هفته مهندسی به یک بعدازظهر کار انطباقی تقلیل می‌دهد. فرمت را توصیف کنید. روی سوابق واقعی آزمایش کنید. راه‌اندازی کنید. تمام.

منابع

آماده‌اید داده‌های خود را محافظت کنید؟

شروع به ناشناس‌سازی PII با بیش از ۲۸۵ نوع نهاد در ۴۸ زبان.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.