Откривање на HIPAA MRN без докторат по регуларни изрази
Форматот на MRN на вашата болница не се наоѓа во ниту една стандардна алатка за лични податоци. Еве како да го додадете за пет минути. Без код.
IT тимовите во здравствената заштита се соочуваат со HIPAA проблем кој другите сектори не го имаат. ID-то кое најмногу треба да го пронајдат — бројот на медицинскиот запис — го поставува нивната сопствена болница. Не постои национален стандард.
Секој проект за де-идентификација по HIPAA бара прилагодено поставување. Без тоа, MRN-ите се провлекуваат низ "де-идентификувани" датотеки неоткриени.
Проблемот со MRN во повеќе установи
Болничките мрежи изградени преку спојувања имаат наследни EHR системи. Секој систем има свој формат на MRN:
- Memorial Hospital (Epic): MRN:XXXXXXX — 7-цифрен број со префикс
- St. Mary's (Cerner): PT-YYYYY — 5-цифрен со префикс за пациент
- University Hospital (Meditech): UHN-XXXXXXXXXX — мешавина од 10 карактери
- Клиника (самостоен EMR): C\d{5} — буква C плус 5 цифри
HIPAA Safe Harbor бара отстранување на сите 18 видови ID. Категорија 8 се броеви на медицински записи. Алатка која не го знае вашиот формат ќе ги пропушти. Датотеката изгледа чиста. Не е.
Заедницата на ServiceNow за здравствена заштита го забележала токму овој проблем. Стандардните алатки ги препознаваат ЕМБГ и телефонски броеви. MRN-ите на установата ги пропуштаат секој пат.
Пречката на регуларните изрази
Додавањето на прилагодени правила на Microsoft Presidio — отворената база за многу HIPAA алатки — бара вистинска вештина:
- Треба да ја познавате класата PatternRecognizer
- Мора да напишете регуларни изрази во синтакса на Python
- Мора да поставите конфигурациски YAML датотеки
- Мора да прилагодувате оценки на доверба
- Мора да тестирате и дебагирате Python скрипти
Офицер за усогласеност кој го знае форматот на MRN не може да го стори ова самостојно. Поправката завршува како инженерски тикет. Седи во редица 6–8 недели. Јазнината останува отворена.
Генерирање на обрасци со помош на AI
Постои побрз начин. Опишете го образецот со обични зборови. Добијте назад работечки регуларен израз.
Чекори:
- Отворете го градителот на прилагодени ентитети
- Дадете примери: "Нашите MRN-и изгледаат вака: MRN:1234567, MRN:9876543, MRN:0001234"
- AI го гради правилото: MRN:\d{7}
- Тестирајте на 10 примерни записи
- Сите MRN-и се пронајдени? Зачувајте и распоредете.
За мрежа со четири формати на MRN:
- Memorial Hospital → MRN:\d{7}
- St. Mary's → PT-\d{5}
- University Hospital → UHN-[A-Z0-9]{10}
- Клиника → C\d{5}
Направете четири прилагодени ентитети. Групирајте ги во предлошка. Стартувајте на сите датотеки. Времето: едно попладне.
Видете прилагодено откривање на MRN во HIPAA цевоводи без код за целосен водич.
Валидација за Safe Harbor
HIPAA Safe Harbor вели дека покриениот субјект не смее да има "вистинско знаење" дека податоците можат да идентификуваат некого. (45 CFR §164.514(b))
Валидацијата покажува дека вашите прилагодени правила ги покриваат сите 18 видови ID.
Чекор 1: Извлечете примероци. Земете 100 записи од секоја установа. Мешајте временски периоди и одделенија.
Чекор 2: Стартувајте откривање. Обработете ги сите 400 документи со вашите прилагодени правила.
Чекор 3: Проверка од луѓе. Прегледајте 20 документи рачно (примерок од 5%). Барајте пропуштени MRN-и и лажни погодоци.
Чекор 4: Усовршете ги правилата. Пропуштени MRN-и? Проширете го образецот. Премногу лажни погодоци? Додадете граници на зборови.
Чекор 5: Запишете го. Евидентирајте го правилото, големината на примерокот, резултатите и датумот. Овој дневник е вашиот запис за Safe Harbor.
Видете објаснувачка редакција и ревизиски патеки по HIPAA за повеќе информации за тоа што треба да се документира.
Целосна покриеност на Safe Harbor
По поправањето на откривањето на MRN, проверете ги сите 18 категории.
| Категорија | Стандардни алатки | Потребно прилагодување? |
|---|---|---|
| 1. Имиња | NER модел | Не |
| 2. Географски податоци | Откривање на локација | Не за држава; Да за кодови на установи |
| 3. Датуми | Откривање на датуми | Не |
| 4. Телефонски броеви | Откривање на телефон | Не |
| 5. Факс броеви | Откривање на телефон | Не |
| 6. Е-пошта адреси | Откривање на е-пошта | Не |
| 7. ЕМБГ | Откривање на ЕМБГ | Не |
| 8. Броеви на медицински записи | Не е вградено | Да — специфично за установата |
| 9. Броеви на членови на здравствен план | Делумно | Честопати да — специфично за исплатувачот |
| 10. Броеви на сметки | Делумно | Честопати да — формат за наплата |
| 11. Броеви на лиценци | Делумно | Честопати да — специфично за државата |
| 12. ID-а на возила | Делумно | Ретки во клинички документи |
| 13. ID-а на уреди | Делумно | Да ако уредите се во записите |
| 14. URL-адреси | Откривање на URL | Не |
| 15. IP адреси | Откривање на IP | Не |
| 16. Биометриски ID-а | Текстуален контекст | Ретки во извештаи за отпуст |
| 17. Фотографии | Само слики | Надвор од опсег за текст |
| 18. Други уникатни ID-а | Не е вградено | Да — специфично за установата |
За клинички текст, категориите 8, 9, 10 и 18 најчесто бараат прилагодено поставување.
Контекст на клинички документи
Извештаите за отпуст, клиничките белешки и оперативните извештаи се главните датотеки кои се споделуваат за истражување. Тие содржат:
- MRN-и во заглавија и подножја
- Броеви на сметки во одделенија за наплата
- Датуми за сите настани — прием, процедура, лабораторија, лек
- Имиња на лекари и DEA броеви
- Информации за упатувачкиот лекар
- Членски ID-а за осигурување
Прилагодените правила за формати специфични за установата се комбинираат со вградените правила за стандардни формати. Тој пар ви дава целосна покриеност на Safe Harbor.
Заклучок
Де-идентификацијата по HIPAA без прилагодени правила не е де-идентификација по Safe Harbor. Форматот на MRN на секоја болница е уникатен. Стандардните алатки ги пропуштаат. Јазнината за усогласеност е реална и останува отворена додека не ја затворите.
Генерирањето на обрасци со AI го скратува поправањето од 6–8 недели инженерство до едно попладне на работа за усогласеност. Опишете го форматот. Тестирајте го на вистински записи. Распоредете го. Готово.