18 идентификаторов PHI по HIPAA, которые пропускает ваш инструмент
Обновлено в 2026 году.
HIPAA перечисляет 18 категорий идентификаторов PHI. Большинство инструментов анонимизации обнаруживают около шести из них. Остальные двенадцать проходят незамеченными — и каждый из них представляет собой пробел в соответствии.
Правило Safe Harbor
Правило конфиденциальности HIPAA (45 CFR § 164.514) определяет деидентификацию по методу Safe Harbor. Все 18 категорий идентификаторов должны быть удалены. Удалите каждую из них — и данные считаются деидентифицированными по закону. Именно поэтому Safe Harbor так популярен: это бинарный критерий, не требующий субъективной оценки.
18 категорий:
- Имена
- Географические данные ниже уровня штата — адрес улицы, город, округ, почтовый индекс
- Даты (кроме года) — рождения, поступления, выписки, смерти
- Номера телефонов
- Номера факсов
- Адреса электронной почты
- Номера социального страхования
- Идентификаторы медицинских карт (MRN)
- Коды бенефициаров медицинского страхования
- Идентификаторы счетов
- Коды сертификатов и лицензий
- Идентификаторы транспортных средств и серийные коды
- Идентификаторы устройств и серийные коды
- URL-адреса сайтов
- IP-адреса
- Биометрические идентификаторы — отпечатки пальцев, голосовые отпечатки
- Полноформатные фотографии лица и аналогичные изображения
- Любые другие уникальные идентифицирующие коды или значения
Большинство инструментов хорошо справляются с категориями 1, 4, 6 и 7. Категории 8, 9, 10, 11, 13 и 18 они пропускают систематически.
Пробел в обнаружении MRN
Идентификаторы медицинских карт относятся к категории 8. Форматы MRN устанавливаются каждой больницей самостоятельно. Единого национального стандарта в США не существует.
Больница A использует 7-значное целое число. Больница B — «PT-YYYYNNNN». Больница C — 8-символьную буквенно-цифровую строку. Больница D записывает «MRN: » перед 9-значным кодом.
Универсальный инструмент не пометит «PT-2024-8847» как PHI. Документ пройдёт проверку деидентификации. Но он не является деидентифицированным. Никакого предупреждения не появится. Команда считает задачу выполненной. На самом деле — нет.
Это наихудший вид пробела: незаметный.
Три способа устранить проблему
Реализовать в Presidio. Требует навыков Python и постоянного сопровождения. Работает, но требует времени.
Добавить ручную проверку. Человек проверяет каждый документ на наличие MRN. Не масштабируется.
Использовать AI-ассистированное создание пользовательских сущностей. Код не нужен. Команда предоставляет примеры значений. ИИ строит шаблон.
Как это работает. Команда предоставляет пять образцов MRN: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. ИИ возвращает SVHS-\d{7} и проверяет шаблон на образцах. Команда сохраняет его в свой HIPAA-пресет. Все последующие сессии распознают этот формат. Тот же подход работает для кодов бенефициаров и серийных номеров устройств.
О том, как работают пресеты, читайте в руководстве по обнаружению MRN по HIPAA. Подробнее о рабочем процессе AI-генерации шаблонов.
Скрытое допущение
Многие команды тестируют инструмент на образце документа с именем и номером телефона. Инструмент проходит проверку. Они предполагают полное покрытие. Но в образцах редко встречаются идентификаторы, специфичные для конкретного учреждения. MRN и коды бенефициаров выглядят как случайные строки для универсального инструмента. Они проходят без предупреждения.
Настоящий аудит Safe Harbor сопоставляет все 18 категорий с методом обнаружения. Для категории 8 проверьте работу на реальных образцах MRN вашей больницы. Не предполагайте, что инструмент знает ваш формат.
Полную методологию смотрите в обзоре соответствия HIPAA.
Заключение
Safe Harbor требует устранения всех 18 категорий идентификаторов. Универсальные инструменты охватывают значительно меньше. Пробелы — MRN, коды бенефициаров, серийные номера устройств — не имеют стандартного формата, поэтому универсальные инструменты их пропускают. AI-ассистированные пользовательские сущности закрывают эти пробелы без написания кода и ручной проверки.
Источники
- HHS: HIPAA Safe Harbor, 45 CFR § 164.514 — hhs.gov. VERIFIED.
- Shaip: типы идентификаторов PHI при деидентификации в здравоохранении — shaip.com. VERIFIED-EXTERNAL.
- HHS OCR: обновлённое руководство по деидентификации 2024 года — hhs.gov. VERIFIED.