18 идентификаторов PHI по HIPAA, которые пропускает ваш инструмент

Обновлено в 2026 году.

HIPAA перечисляет 18 категорий идентификаторов PHI. Большинство инструментов анонимизации обнаруживают около шести из них. Остальные двенадцать проходят незамеченными — и каждый из них представляет собой пробел в соответствии.

Правило Safe Harbor

Правило конфиденциальности HIPAA (45 CFR § 164.514) определяет деидентификацию по методу Safe Harbor. Все 18 категорий идентификаторов должны быть удалены. Удалите каждую из них — и данные считаются деидентифицированными по закону. Именно поэтому Safe Harbor так популярен: это бинарный критерий, не требующий субъективной оценки.

18 категорий:

Имена
Географические данные ниже уровня штата — адрес улицы, город, округ, почтовый индекс
Даты (кроме года) — рождения, поступления, выписки, смерти
Номера телефонов
Номера факсов
Адреса электронной почты
Номера социального страхования
Идентификаторы медицинских карт (MRN)
Коды бенефициаров медицинского страхования
Идентификаторы счетов
Коды сертификатов и лицензий
Идентификаторы транспортных средств и серийные коды
Идентификаторы устройств и серийные коды
URL-адреса сайтов
IP-адреса
Биометрические идентификаторы — отпечатки пальцев, голосовые отпечатки
Полноформатные фотографии лица и аналогичные изображения
Любые другие уникальные идентифицирующие коды или значения

Большинство инструментов хорошо справляются с категориями 1, 4, 6 и 7. Категории 8, 9, 10, 11, 13 и 18 они пропускают систематически.

Пробел в обнаружении MRN

Идентификаторы медицинских карт относятся к категории 8. Форматы MRN устанавливаются каждой больницей самостоятельно. Единого национального стандарта в США не существует.

Больница A использует 7-значное целое число. Больница B — «PT-YYYYNNNN». Больница C — 8-символьную буквенно-цифровую строку. Больница D записывает «MRN: » перед 9-значным кодом.

Универсальный инструмент не пометит «PT-2024-8847» как PHI. Документ пройдёт проверку деидентификации. Но он не является деидентифицированным. Никакого предупреждения не появится. Команда считает задачу выполненной. На самом деле — нет.

Это наихудший вид пробела: незаметный.

Три способа устранить проблему

Реализовать в Presidio. Требует навыков Python и постоянного сопровождения. Работает, но требует времени.

Добавить ручную проверку. Человек проверяет каждый документ на наличие MRN. Не масштабируется.

Использовать AI-ассистированное создание пользовательских сущностей. Код не нужен. Команда предоставляет примеры значений. ИИ строит шаблон.

Как это работает. Команда предоставляет пять образцов MRN: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. ИИ возвращает SVHS-\d{7} и проверяет шаблон на образцах. Команда сохраняет его в свой HIPAA-пресет. Все последующие сессии распознают этот формат. Тот же подход работает для кодов бенефициаров и серийных номеров устройств.

О том, как работают пресеты, читайте в руководстве по обнаружению MRN по HIPAA. Подробнее о рабочем процессе AI-генерации шаблонов.

Скрытое допущение

Многие команды тестируют инструмент на образце документа с именем и номером телефона. Инструмент проходит проверку. Они предполагают полное покрытие. Но в образцах редко встречаются идентификаторы, специфичные для конкретного учреждения. MRN и коды бенефициаров выглядят как случайные строки для универсального инструмента. Они проходят без предупреждения.

Настоящий аудит Safe Harbor сопоставляет все 18 категорий с методом обнаружения. Для категории 8 проверьте работу на реальных образцах MRN вашей больницы. Не предполагайте, что инструмент знает ваш формат.

Полную методологию смотрите в обзоре соответствия HIPAA.

Заключение

Safe Harbor требует устранения всех 18 категорий идентификаторов. Универсальные инструменты охватывают значительно меньше. Пробелы — MRN, коды бенефициаров, серийные номера устройств — не имеют стандартного формата, поэтому универсальные инструменты их пропускают. AI-ассистированные пользовательские сущности закрывают эти пробелы без написания кода и ручной проверки.

Источники

HHS: HIPAA Safe Harbor, 45 CFR § 164.514 — hhs.gov. VERIFIED.
Shaip: типы идентификаторов PHI при деидентификации в здравоохранении — shaip.com. VERIFIED-EXTERNAL.
HHS OCR: обновлённое руководство по деидентификации 2024 года — hhs.gov. VERIFIED.

Связанные статьи

Здравоохранение

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.

Начать бесплатный пробный период Посмотреть функции

18 идентификаторов PHI по HIPAA, которые пропускает ваш инструмент