Изискването за 18-идентификатор
Правилото за поверителност на HIPAA (45 CFR, раздел 164.514) определя метода за деидентификация на Safe Harbor: за деидентификация на защитена здравна информация трябва да бъдат премахнати 18 специфични категории идентификатори. Методът Safe Harbor е един от двата HIPAA подхода за деидентификация; използва се по-често, тъй като съответствието е детерминистично — ако всичките 18 категории бъдат премахнати, данните се деидентифицират по закон.
18-те категории:
- Имена
- Географски данни (по-малки от държавата — включително адрес, град, окръг, пощенски код)
- Дати (без година), свързани с лицето — раждане, постъпване, изписване, смърт
- Телефонни номера
- Номера на факсове
- Имейл адреси
- Социалноосигурителни номера
- Номера на медицински досиета (MRN)
- Номера на бенефициентите на здравния план
- Номера на сметки
- Номера на сертификат/лиценз
- Идентификатори на превозни средства и серийни номера
- Идентификатори на устройства и серийни номера
- Уеб URL адреси
- IP адреси
- Биометрични идентификатори (пръстови отпечатъци, гласови отпечатъци)
- Снимки в анфас и сравними изображения
- Всеки друг уникален идентификационен номер или код
Повечето инструменти за откриване на PII надеждно откриват категории 1, 4, 6 и 7 — имена, телефонни номера, имейл адреси и SSN. Те системно се провалят в категории 8, 9, 10, 11, 13 и 18.
Пропускът в откриването на MRN
Номерата на медицинските досиета са изрично посочени като PHI идентификатор (категория 8). MRN форматите са специфични за институцията — няма стандартизиран национален формат. Болница А използва 7-цифрено цяло число. Болница B използва „PT-YYYYNNNN“, където YYYY е година, а NNNN е пореден номер. Болница C използва буквено-цифров низ от 8 знака. Болница D използва "MRN:", последвано от 9-цифрен номер.
Общият инструмент за откриване на PII, който не знае MRN формата на болница B, няма да открие „PT-2024-8847“ като PHI идентификатор. Документът, съдържащ този MRN, ще бъде третиран като деидентифициран след стандартна обработка — когато не е такъв.
Това създава режим на несъответствие, който е невидим за организацията: деидентификацията изглежда завършена, тъй като инструментът не е маркирал никакви нарушения. Липсващото откриване е проблемът.
Решението за потребителски обект
Здравните организации, които се нуждаят от откриване на MRN, имат три възможности. Първо, приложете директно откриването в Presidio — изисквайки опит в програмирането на Python и текуща поддръжка с развитието на MRN форматите. Второ, поддържайте стъпка на ръчен преглед специално за MRNs — създаване на систематична слаба връзка в тръбопровода за деидентификация. Трето, използвайте система, която осигурява създаване на индивидуални обекти с помощта на AI, без да изисква код.
Подходът на помощния модел на AI: екипът по клинична информатика предоставя 5 примерни MRN стойности (SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001) и изисква модел за откриване. AI генерира регулярен израз — SVHS-d{7} — и го валидира спрямо предоставените примери. Шаблонът се записва в предварително зададената HIPAA съвместимост на екипа. Всички следващи сесии за деидентификация откриват този MRN формат автоматично.
Същият подход се прилага и за други специфични за институцията идентификатори: формати на номера на бенефициента на здравния план, формати на серийния номер на оборудването и всички собствени идентификационни кодове, които са специфични за организацията.
Източници:
- [HHS: HIPAA Метод за деидентификация на Safe Harbor, 18 категории идентификатори (45 CFR 164.514)] (https://www.hhs.gov/hipaa/for-professionals/privacy/special-topics/de-identification/index.html)
- [Shaip: Деидентификация в здравеопазването и типове PHI идентификатори] (https://www.shaip.com/blog/de-identification-in-healthcare/)
- [HHS OCR: Указания за OCR за деидентификация, актуализирани през 2024 г. за рискове от повторна идентификация с изкуствен интелект] (https://www.hhs.gov/hipaa/for-professionals/compliance-enforcement/index.html)