HIPAA MRN засичане без докторска степен по regex
Форматът на MRN на вашата болница не е в нито един стандартен ПЛИ инструмент. Ето как да го добавите за пет минути. Не е необходим код.
Екипите по здравна информатика са изправени пред HIPAA проблем, който другите сектори нямат. Идентификаторът, който най-много трябва да намерят - Медицинският регистрационен номер - е зададен от тяхната собствена болница. Не съществува национален стандарт.
Всеки HIPAA проект за деидентификация изисква персонализирана настройка. Без нея, MRN-ите проникват през "деидентифицирани" файлове, незасечени.
Проблемът с MRN при множество заведения
Болничните мрежи, изградени чрез сливания, имат наследени ЕЗД системи. Всяка система има свой собствен MRN формат:
- Memorial Hospital (Epic): MRN:XXXXXXX - 7-цифрено число с префикс
- St. Mary's (Cerner): PT-YYYYY - 5-цифрено с пациентски префикс
- University Hospital (Meditech): UHN-XXXXXXXXXX - 10-знакова комбинация
- Клиника (самостоятелна ЕМЗ): C\d{5} - буква C плюс 5 цифри
HIPAA Safe Harbor изисква премахване на всички 18 типа идентификатори. Категория 8 са медицинските регистрационни номера. Инструмент, който не знае вашия формат, ще ги пропусне. Файлът изглежда чист. Но не е.
Общността на ServiceNow за здравеопазване е отбелязала точно този проблем. Стандартните инструменти засичат ЕГН и телефонни номера. Пропускат MRN-ите на заведенията всеки път.
Бариерата на regex
Добавянето на персонализирани правила към Microsoft Presidio - отворения код, на базата на много HIPAA инструменти - изисква реални умения:
- Трябва да познавате класа PatternRecognizer
- Трябва да пишете regex в Python синтаксис
- Трябва да настроите YAML конфигурационни файлове
- Трябва да настроите оценки на доверие
- Трябва да тествате и отстранявате грешки в Python скриптове
Служителят по съответствието, който знае формата на MRN, не може да направи това сам. Решението завършва като инженерна задача. Тя стои в опашката 6-8 седмици. Пропастта остава отворена.
Генериране на шаблони с AI
Има по-бърз начин. Опишете шаблона с обикновени думи. Получете работещ regex в замяна.
Стъпки:
- Отворете конструктора за персонализирани обекти
- Дайте примери: "Нашите MRN-и изглеждат така: MRN:1234567, MRN:9876543, MRN:0001234"
- AI изгражда правилото: MRN:\d{7}
- Тествайте върху 10 примерни записа
- Всички MRN-и открити? Запазете и разгърнете.
За мрежа с четири MRN формата:
- Memorial Hospital - MRN:\d{7}
- St. Mary's - PT-\d{5}
- University Hospital - UHN-[A-Z0-9]{10}
- Клиника - C\d{5}
Направете четири персонализирани обекта. Групирайте ги в настройка. Стартирайте върху всички файлове. Време: един следобед.
Вижте персонализирано засичане на MRN в HIPAA конвейери без код за пълно ръководство.
Валидиране за Safe Harbor
HIPAA Safe Harbor гласи, че покритото заведение не трябва да има "действително знание", че данните могат да идентифицират някого. (45 CFR §164.514(b))
Валидирането показва, че вашите персонализирани правила покриват всички 18 типа идентификатори.
Стъпка 1: Вземете примери. Вземете 100 записа от всеки обект. Смесете времеви периоди и отдели.
Стъпка 2: Стартирайте засичане. Обработете всичките 400 документа с вашите персонализирани правила.
Стъпка 3: Проверка от човек. Прегледайте 20 документа ръчно (5% извадка). Потърсете пропуснати MRN-и и фалшиви засичания.
Стъпка 4: Прецизирайте правилата. Пропуснати MRN-и? Разширете шаблона. Твърде много фалшиви засичания? Добавете граници на думи.
Стъпка 5: Запишете го. Регистрирайте правилото, размера на извадката, резултатите и датата. Този дневник е вашият запис за Safe Harbor.
Вижте обяснимо заличаване и одитни пътеки за HIPAA за повече информация за документирането.
Пълно покритие на Safe Harbor
След поправяне на засичането на MRN, проверете всичките 18 категории.
| Категория | Стандартни инструменти | Нужна персонализация? |
|---|---|---|
| 1. Имена | NER модел | Не |
| 2. Географски данни | Засичане на местоположение | Не за щат; Да за кодове на обекти |
| 3. Дати | Засичане на дати | Не |
| 4. Телефонни номера | Засичане на телефони | Не |
| 5. Факс номера | Засичане на телефони | Не |
| 6. Имейл адреси | Засичане на имейли | Не |
| 7. ЕГН | Засичане на ЕГН | Не |
| 8. Медицински регистрационни номера | Не вградено | Да - специфично за обекта |
| 9. Номера на членове в здравен план | Частично | Често да - специфично за платеца |
| 10. Номера на сметки | Частично | Често да - формат за фактуриране |
| 11. Номера на лицензи | Частично | Често да - специфично за щата |
| 12. Идентификатори на превозни средства | Частично | Рядко в клинични документи |
| 13. Идентификатори на устройства | Частично | Да, ако устройствата са в записите |
| 14. Уеб URL-и | Засичане на URL | Не |
| 15. IP адреси | Засичане на IP | Не |
| 16. Биометрични идентификатори | Текстов контекст | Рядко в изписни бележки |
| 17. Снимки | Само изображения | Извън обхвата за текст |
| 18. Други уникални идентификатори | Не вградено | Да - специфично за обекта |
За клинични текстове, категории 8, 9, 10 и 18 най-често изискват персонализирана настройка.
Контекст на клинични документи
Изписни бележки, клинични бележки и оперативни доклади са основните файлове, споделяни за изследвания. Те съдържат:
- MRN-и в горни и долни колонтитули
- Номера на сметки в секции за фактуриране
- Дати за всички събития - постъпване, процедура, лаборатория, лекарства
- Имена на лекари и DEA номера
- Информация за насочващия лекар
- Идентификатори на членове на застраховката
Персонализираните правила за специфични за обекта формати се съчетават с вградени правила за стандартни формати. Тази двойка ви дава пълно покритие на Safe Harbor.
Заключение
HIPAA деидентификацията без персонализирани правила не е Safe Harbor деидентификация. Форматът на MRN на всяка болница е уникален. Стандартните инструменти ги пропускат. Пропастта в съответствието е реална и остава отворена, докато не я затворите.
Генерирането на AI шаблони намалява поправката от 6-8 седмици инженерна работа до един следобед на работа по съответствието. Опишете формата. Тествайте го върху реални записи. Разгърнете го. Готово.