Деідентифікація HIPAA без докторату з регулярних виразів: створення шаблонів MRN за допомогою AI
Формат номера медичного запису (MRN) вашої лікарні не існує в жодному стандартному інструменті PII. Ось як додати його за 5 хвилин, не написавши жодного рядка регулярного виразу.
Команди IT охорони здоров'я, що реалізують деідентифікацію HIPAA, стикаються зі специфічним викликом, якого немає в інших секторах: ідентифікатор, який вони найбільше потребують виявляти — MRN пацієнта — не має стандартизованого формату.
Проблема: нестандартизовані формати MRN
Виробники EHR реалізують MRN по-різному:
- Epic: Числові, зазвичай 7–9 цифр (1234567, 12345678)
- Cerner: Алфавітно-цифрові з префіксами, специфічними для закладу (PT12345, E-123456)
- Meditech: Різні формати залежно від версії та конфігурації закладу
- Кастомні EHR: Формати, що визначаються закладом, зазвичай із специфічними для закладу префіксами або суфіксами
Для Memorial Health: MRN:7654321 Для St. Mary's Regional: PT-98765 Для University Hospital Network: UHN-2024-001234
Жоден з них не буде виявлений загальним інструментом PII без кастомної конфігурації.
Рішення: генерація шаблонів MRN за допомогою AI
Замість написання регулярного виразу вручну (що вимагає знань регулярних виразів та налагоджувального тестування):
Крок 1: Запит до AI Попросіть ChatGPT або Claude: «Напиши регулярний вираз Python, що відповідає медичним номерам записів у форматі MRN:XXXXXXX, де X — це цифра. Тест повинен відповідати MRN:1234567, але не відповідати MRN:123 або MRN:12345678.»
Крок 2: Тестування шаблону
import re
pattern = r'MRN:\d{7}'
test_cases = ['MRN:1234567', 'MRN:123', 'MRN:12345678', 'PT:1234567']
for t in test_cases:
print(f'{t}: {bool(re.search(pattern, t))}')
Крок 3: Конфігурація в anonym.legal Додайте шаблон як кастомну сутність через API:
{
"name": "MRN_MEMORIAL",
"pattern": "MRN:\\d{7}",
"context": ["medical record", "patient", "record number"]
}
Джерела: