anonym.legal
Назад към блогаЗдравеопазване

Деидентифициран, но не изчезнал: Обратимо криптиране...

Не можете да се свържете с Patient_001 за последващо посещение. IRB вече изискват документирани протоколи за повторна идентификация — доказващи...

April 20, 20268 мин. четене
research re-identification protocollongitudinal study follow-upIRB pseudonymization requirementcontrolled re-identificationdeterministic encryption

Изискването на протокола за повторна идентификация на IRB

IRB сега обикновено изискват от изследователите да документират техния протокол за повторна идентификация - не само техния метод за деидентификация. Документацията трябва да докаже две неща едновременно: че деидентифицираният набор от данни не може да бъде повторно идентифициран от неоторизирани страни и че разрешеното повторно идентифициране е възможно при определени условия.

Това двойно изискване отразява поуките от надлъжно изследване, при което клинично приложими констатации се появяват по средата на проучването, но постоянната анонимност предотвратява действията по тях. Действията по правоприлагането на GDPR се увеличиха с 56% през 2024 г. (Годишен доклад на DLA Piper за 2025 г.), а освобождаването на изследванията в ЕС съгласно член 89 конкретно изисква псевдонимизация, а не постоянна анонимност за изследователски данни — като се признава, че изследванията изискват обратимост при контролирани условия.

Документ NEJM AI от 2024 г. за деидентификация, базирана на LLM, изрично отбелязва това предизвикателство: „деидентифицираните клинични бележки остават статистически свързани с идентичността чрез самите корелации, които потвърждават тяхната клинична полезност“. Препоръката на документа: псевдонимизация с документирано съхранение на ключове, вместо постоянна анонимност, специално за запазване на способността за повторен контакт, която изисква надлъжното изследване.

Архитектурата за контролирана повторна идентификация

Детерминистичното AES-256-GCM криптиране генерира последователни токени: един и същ идентификатор на пациента винаги шифрова към един и същ токен, използвайки един и същ ключ. „Пациент_001“ в основната оценка се криптира до „[ENC:f8a2c...]“ — същият токен се появява в 3-месечното проследяване, 12-месечното проследяване и крайния анализ. Изследователският екип може да проследи надлъжните данни на пациента, като използва криптирания токен като стабилен идентификатор, без изобщо да има достъп до истинската самоличност.

Споразумението за попечителство на ключове удовлетворява изискването за разделяне на ключовете на EDPB: изследователският екип съхранява криптирания набор от данни. Определеният пазител на данни държи ключа за дешифриране в отделна система за управление на ключове. Нито една от страните не може да идентифицира повторно участниците без другата – изследователският екип не може да декриптира без ключа, а попечителят на ключа не може да идентифицира кои записи на кои участници принадлежат без данните.

Когато повторното идентифициране е разрешено (одобрение от комисията по етика, констатация за задължение за предупреждение, регулаторно изискване), попечителят на ключа прилага ключа към конкретните идентифицирани записи. Всяко събитие за дешифриране се регистрира: кои записи, кога, от кого, с какво разрешение. Одитният дневник демонстрира съответствие с изискванията на член 89 от GDPR за документирани предпазни мерки.

Практическо изпълнение

За европейски онкологичен изследователски център с кохорта от 5000 пациенти: наборът от изследователски данни се анонимизира с помощта на обратимо криптиране преди разпространение до сътрудничещи си институции в три държави. Изследователският екип на всяка институция може да анализира надлъжни данни, използвайки криптирани токени на пациента. Ключът се държи от длъжностното лице по защита на данните на координиращата институция.

Когато анализ на биомаркери в средата на проучването идентифицира 47 участници с повишени рискови маркери, одобрението на комисията по етика задейства официално искане за повторна идентификация. Служителят по защита на данните декриптира 47-те конкретни записа. Клиничният екип на координиращата институция се свързва с 47-те реални пациенти. Самоличността на останалите 4953 участници остава защитена във всичките три сътрудничещи институции.

Източници:

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.