anonym.legal

By · Last updated 2026-06-04

Назад на блоготЗдравство

Откривање на HIPAA MRN без докторат по регуларни изрази

Форматот на MRN на секоја болница е различен. Memorial користи MRN:XXXXXXX, St. Mary's користи PT-YYYYY, University Hospital користи UHN-XXXXXXXXXX.

June 4, 20266 мин читање
HIPAA de-identificationMRN patternhealthcare ITAI pattern generationPHI detection

Откривање на HIPAA MRN без докторат по регуларни изрази

Форматот на MRN на вашата болница не се наоѓа во ниту една стандардна алатка за лични податоци. Еве како да го додадете за пет минути. Без код.

IT тимовите во здравствената заштита се соочуваат со HIPAA проблем кој другите сектори не го имаат. ID-то кое најмногу треба да го пронајдат — бројот на медицинскиот запис — го поставува нивната сопствена болница. Не постои национален стандард.

Секој проект за де-идентификација по HIPAA бара прилагодено поставување. Без тоа, MRN-ите се провлекуваат низ "де-идентификувани" датотеки неоткриени.

Проблемот со MRN во повеќе установи

Болничките мрежи изградени преку спојувања имаат наследни EHR системи. Секој систем има свој формат на MRN:

  • Memorial Hospital (Epic): MRN:XXXXXXX — 7-цифрен број со префикс
  • St. Mary's (Cerner): PT-YYYYY — 5-цифрен со префикс за пациент
  • University Hospital (Meditech): UHN-XXXXXXXXXX — мешавина од 10 карактери
  • Клиника (самостоен EMR): C\d{5} — буква C плус 5 цифри

HIPAA Safe Harbor бара отстранување на сите 18 видови ID. Категорија 8 се броеви на медицински записи. Алатка која не го знае вашиот формат ќе ги пропушти. Датотеката изгледа чиста. Не е.

Заедницата на ServiceNow за здравствена заштита го забележала токму овој проблем. Стандардните алатки ги препознаваат ЕМБГ и телефонски броеви. MRN-ите на установата ги пропуштаат секој пат.

Пречката на регуларните изрази

Додавањето на прилагодени правила на Microsoft Presidio — отворената база за многу HIPAA алатки — бара вистинска вештина:

  • Треба да ја познавате класата PatternRecognizer
  • Мора да напишете регуларни изрази во синтакса на Python
  • Мора да поставите конфигурациски YAML датотеки
  • Мора да прилагодувате оценки на доверба
  • Мора да тестирате и дебагирате Python скрипти

Офицер за усогласеност кој го знае форматот на MRN не може да го стори ова самостојно. Поправката завршува како инженерски тикет. Седи во редица 6–8 недели. Јазнината останува отворена.

Генерирање на обрасци со помош на AI

Постои побрз начин. Опишете го образецот со обични зборови. Добијте назад работечки регуларен израз.

Чекори:

  1. Отворете го градителот на прилагодени ентитети
  2. Дадете примери: "Нашите MRN-и изгледаат вака: MRN:1234567, MRN:9876543, MRN:0001234"
  3. AI го гради правилото: MRN:\d{7}
  4. Тестирајте на 10 примерни записи
  5. Сите MRN-и се пронајдени? Зачувајте и распоредете.

За мрежа со четири формати на MRN:

  • Memorial Hospital → MRN:\d{7}
  • St. Mary's → PT-\d{5}
  • University Hospital → UHN-[A-Z0-9]{10}
  • Клиника → C\d{5}

Направете четири прилагодени ентитети. Групирајте ги во предлошка. Стартувајте на сите датотеки. Времето: едно попладне.

Видете прилагодено откривање на MRN во HIPAA цевоводи без код за целосен водич.

Валидација за Safe Harbor

HIPAA Safe Harbor вели дека покриениот субјект не смее да има "вистинско знаење" дека податоците можат да идентификуваат некого. (45 CFR §164.514(b))

Валидацијата покажува дека вашите прилагодени правила ги покриваат сите 18 видови ID.

Чекор 1: Извлечете примероци. Земете 100 записи од секоја установа. Мешајте временски периоди и одделенија.

Чекор 2: Стартувајте откривање. Обработете ги сите 400 документи со вашите прилагодени правила.

Чекор 3: Проверка од луѓе. Прегледајте 20 документи рачно (примерок од 5%). Барајте пропуштени MRN-и и лажни погодоци.

Чекор 4: Усовршете ги правилата. Пропуштени MRN-и? Проширете го образецот. Премногу лажни погодоци? Додадете граници на зборови.

Чекор 5: Запишете го. Евидентирајте го правилото, големината на примерокот, резултатите и датумот. Овој дневник е вашиот запис за Safe Harbor.

Видете објаснувачка редакција и ревизиски патеки по HIPAA за повеќе информации за тоа што треба да се документира.

Целосна покриеност на Safe Harbor

По поправањето на откривањето на MRN, проверете ги сите 18 категории.

КатегоријаСтандардни алаткиПотребно прилагодување?
1. ИмињаNER моделНе
2. Географски податоциОткривање на локацијаНе за држава; Да за кодови на установи
3. ДатумиОткривање на датумиНе
4. Телефонски броевиОткривање на телефонНе
5. Факс броевиОткривање на телефонНе
6. Е-пошта адресиОткривање на е-поштаНе
7. ЕМБГОткривање на ЕМБГНе
8. Броеви на медицински записиНе е вграденоДа — специфично за установата
9. Броеви на членови на здравствен планДелумноЧестопати да — специфично за исплатувачот
10. Броеви на сметкиДелумноЧестопати да — формат за наплата
11. Броеви на лиценциДелумноЧестопати да — специфично за државата
12. ID-а на возилаДелумноРетки во клинички документи
13. ID-а на уредиДелумноДа ако уредите се во записите
14. URL-адресиОткривање на URLНе
15. IP адресиОткривање на IPНе
16. Биометриски ID-аТекстуален контекстРетки во извештаи за отпуст
17. ФотографииСамо сликиНадвор од опсег за текст
18. Други уникатни ID-аНе е вграденоДа — специфично за установата

За клинички текст, категориите 8, 9, 10 и 18 најчесто бараат прилагодено поставување.

Контекст на клинички документи

Извештаите за отпуст, клиничките белешки и оперативните извештаи се главните датотеки кои се споделуваат за истражување. Тие содржат:

  • MRN-и во заглавија и подножја
  • Броеви на сметки во одделенија за наплата
  • Датуми за сите настани — прием, процедура, лабораторија, лек
  • Имиња на лекари и DEA броеви
  • Информации за упатувачкиот лекар
  • Членски ID-а за осигурување

Прилагодените правила за формати специфични за установата се комбинираат со вградените правила за стандардни формати. Тој пар ви дава целосна покриеност на Safe Harbor.

Заклучок

Де-идентификацијата по HIPAA без прилагодени правила не е де-идентификација по Safe Harbor. Форматот на MRN на секоја болница е уникатен. Стандардните алатки ги пропуштаат. Јазнината за усогласеност е реална и останува отворена додека не ја затворите.

Генерирањето на обрасци со AI го скратува поправањето од 6–8 недели инженерство до едно попладне на работа за усогласеност. Опишете го форматот. Тестирајте го на вистински записи. Распоредете го. Готово.

Извори

Подготвени да ги заштитите вашите податоци?

Започнете со анонимизација на PII со 285+ типови на ентитети на 48 јазици.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.