18 ідентифікаторів HIPAA, які пропускає ваш інструмент
Оновлено у 2026 році.
HIPAA перераховує 18 категорій ідентифікаторів PHI. Більшість інструментів анонімізації виявляють, можливо, шість. Решта дванадцяти проходять непоміченими — і кожна з них є прогалиною у відповідності.
Правило Safe Harbor
Правило про конфіденційність HIPAA (45 CFR § 164.514) визначає деідентифікацію за методом Safe Harbor. Усі 18 категорій ідентифікаторів мають бути видалені. Видаліть кожну з них — і дані вважаються деідентифікованими за законом. Саме тому Safe Harbor є популярним: це або пройшов, або не пройшов — без суб'єктивних оцінок.
18 категорій:
- Імена
- Географічні дані менші за штат — поштова адреса, місто, округ, поштовий індекс
- Дати, крім року — народження, госпіталізації, виписки, смерті
- Номери телефонів
- Номери факсів
- Електронні адреси
- Номери соціального страхування
- Ідентифікатори медичних карток (MRN)
- Коди бенефіціарів планів медичного страхування
- Ідентифікатори рахунків
- Коди сертифікатів і ліцензій
- Ідентифікатори транспортних засобів і серійні номери
- Ідентифікатори пристроїв і серійні номери
- Веб-адреси (URL)
- IP-адреси
- Біометричні ідентифікатори — відбитки пальців, голосові відбитки
- Повні фотографії обличчя та подібні зображення
- Будь-які інші унікальні ідентифікаційні коди або значення
Більшість інструментів добре обробляють категорії 1, 4, 6 і 7. Вони регулярно пропускають 8, 9, 10, 11, 13 і 18.
Прогалина у виявленні MRN
Ідентифікатори медичних карток перебувають у категорії 8. Формати MRN встановлюються кожною лікарнею окремо. Загальноамериканського стандарту не існує.
Лікарня A використовує 7-значне ціле число. Лікарня B використовує «PT-РРРРНННН». Лікарня C використовує 8-символьний буквено-цифровий рядок. Лікарня D пише «MRN: » перед 9-значним кодом.
Генеричний інструмент не позначить «PT-2024-8847» як PHI. Документ пройде перевірку деідентифікації. Але він не є деідентифікованим. Жодного сповіщення не надходить. Команда вважає роботу виконаною. Це не так.
Це найгірший вид прогалини: непомітна.
Три способи виправити ситуацію
Запрограмувати у Presidio. Це вимагає навичок Python і постійного обслуговування. Підхід працює, але потребує часу.
Додати ручну перевірку. Людина перевіряє кожен документ на наявність MRN. Це не масштабується.
Використати AI-підтримку для створення спеціальних сутностей. Без коду. Команда надає зразки значень. ШІ будує шаблон.
Ось як це працює. Команда надає п'ять зразків значень MRN: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. ШІ повертає SVHS-\d{7} і перевіряє на зразках. Команда зберігає шаблон у своєму пресеті HIPAA. Усі подальші сесії виявляють цей формат. Той самий підхід працює для кодів бенефіціарів і серійних номерів пристроїв.
Дивіться, як працюють пресети, у посібнику з виявлення MRN HIPAA. Дізнайтеся про AI-процес роботи з шаблонами.
Прихована хибна передумова
Багато команд тестують на зразковому документі з іменем і номером телефону. Інструмент проходить. Вони припускають повне покриття. Але зразки рідко включають специфічні для установи ідентифікатори. MRN і коди бенефіціарів виглядають як випадкові рядки для генеричного інструменту. Вони проходять без позначення.
Справжній аудит Safe Harbor відображає всі 18 категорій на метод виявлення. Для категорії 8 перевіряйте з реальними зразками MRN з вашої лікарні. Не припускайте, що інструмент знає ваш формат.
Ознайомтеся з повною структурою в нашому огляді відповідності HIPAA.
Висновок
Safe Harbor вимагає видалення всіх 18 категорій ідентифікаторів. Генеричні інструменти охоплюють значно менше. Прогалини — MRN, коди бенефіціарів, серійні номери пристроїв — не мають стандартного формату, тому генеричні інструменти їх пропускають. Спеціальні сутності з підтримкою ШІ закривають прогалину без коду або ручної перевірки.
Джерела
- HHS: HIPAA Safe Harbor, 45 CFR § 164.514 — hhs.gov. VERIFIED.
- Shaip: Типи ідентифікаторів PHI при деідентифікації у сфері охорони здоров'я — shaip.com. VERIFIED-EXTERNAL.
- HHS OCR: Настанови з деідентифікації оновлено у 2024 році — hhs.gov. VERIFIED.