Проблема форматів MRN
У США близько 6 100 лікарень. Кожна використовує власну EHR-систему. Кожна має власний формат Medical Record Number. Жодного національного стандарту не існує. Об'єднана комісія вимагає, щоб лікарні могли ідентифікувати пацієнтів — але не встановлює правил формату.
Формати суттєво відрізняються. Одні — 7-цифрові цілі числа. Інші — 8-цифрові. Частина використовує префікси: HOSP-, MRN- або PT-. Інші додають інституційні коди: SVHS- або CHOP-. Деякі вбудовують рік реєстрації у номер.
HIPAA Safe Harbor відносить номери записів пацієнтів до 8-го типу ідентифікаторів із 18 (45 CFR §164.514(b)(2)). Всі 18 мають бути видалені. Правило не обмежується жодним конкретним форматом. Якщо ваша лікарня використовує власний формат — ви повинні його виявляти. Інструмент, який його пропускає, не відповідає Safe Harbor — навіть якщо видаляє всі інші 17 типів.
Чому підхід із написанням коду не спрацьовує
Стандартний спосіб додати власний формат номера запису до пайплайну деідентифікації — це розширення Microsoft Presidio. Тобто написання Python-коду.
Розробник створює клас, що успадковується від EntityRecognizer. Пише регулярний вираз, підключає його до реєстру Presidio, тестує та підтримує. Для compliance-команд — які рідко програмують — це нездоланний бар'єр. Кожна зміна формату потребує інженера.
Інженери у сфері охорони здоров'я завантажені. Вони фокусуються на інтеграції з EHR та клінічними системами. Compliance-інструментарій рідко є їхнім пріоритетом.
Робочий процес без написання коду
Підхід із керованим введенням шаблону прибирає крок написання коду.
Compliance-менеджер відкриває Custom Entity Creator у веб-застосунку. Вставляє п'ять зразкових номерів зі своєї системи — наприклад:
SVHS-0012345
SVHS-0987654
SVHS-1122334
SVHS-4455667
SVHS-8899001
Натискає Generate Pattern (Згенерувати шаблон). ШІ аналізує структуру і повертає:
- Шаблон:
SVHS-\d{7} - Достовірність: висока
- Запропонована назва:
HOSPITAL-MRN - Запропонована заміна:
[MRN]
Менеджер вставляє ще п'ять зразків. Шаблон проходить перевірку. Він зберігає його у пресет HIPAA.
Після цього кожна сесія — веб-застосунок, Office Add-in, Desktop App і API — виявляє цей формат у стандартному проході PHI. Код не потрібен.
Примітка щодо GDPR для досліджень
Стаття 89 GDPR вимагає псевдонімізації для дослідницьких датасетів. Власні сутності включають інституційні ідентифікатори до зони охоплення — закриваючи прогалину, яку залишають загальні інструменти.
Що ви отримуєте
Цей процес займає один день. Написання власного коду — тижні.
Compliance-менеджер визначає шаблон, тестує і розгортає його. Без заявок. Без очікування. Пресет зберігає власну сутність поруч зі стандартними 17 ідентифікаторами Safe Harbor.
Коли наступний пакет клінічних нотаток обробляється, всі 18 типів ідентифікаторів охоплені. Safe Harbor виконаний.
Дивіться деідентифікацію HIPAA Safe Harbor для медичних досліджень для розуміння принципів роботи Safe Harbor. Для виявлення шаблонів, специфічних для конкретних лікарень, дивіться виявлення MRN-форматів без залучення інженерів.