anonym.legal
Назад към блогаПравни технологии

Постоянният капан за анонимизиране: Защо необратимото...

34,8% от входовете ChatGPT съдържат чувствителни данни (Cyberhaven). Поправката - постоянна анонимизация - създава собствен правен риск: разграбване.

March 15, 202610 мин. четене
reversible encryptionspoliation risklegal discovery complianceGDPR pseudonymizationAES-256-GCM

Проблемът с решаването на един риск от съответствие чрез създаване на друг

Организациите, които са интернализирали риска от изтичане на данни от AI инструментите, често прилагат логично изглеждащо решение: анонимизирайте чувствителното съдържание, преди да достигне до доставчиците на AI, като използвате постоянна или еднопосочна анонимност, която не може да бъде обърната.

Логиката е здрава от страна на сигурността. Анализът на Cyberhaven за Q4 2025 установи, че 34,8% от съдържанието, изпратено до ChatGPT съдържа чувствителна информация. Проучването на Ponemon Institute от 2024 г. установи, че средната цена на изтичане на данни от AI е $2,1 милиона. Проучване на eSecurity Planet и Cyberhaven установи, че 77% от служителите споделят чувствителни данни с AI инструменти на седмична база. Рискът е реален, често срещан и скъп.

Но постоянната анонимизация – необратимо еднопосочно хеширане, деструктивна редакция или псевдонимизация без запазване на ключове – решава проблема със сигурността на AI, като същевременно създава различен: кражба на доказателства.

За организации, подлежащи на съдебни спорове, регулаторни разследвания или задължения за откриване, трайното унищожаване на способността за възстановяване на оригинални данни от тяхното анонимно представяне може да представлява разграбване съгласно федералните и щатските правила за откриване. Документ, който е бил трайно анонимизиран и от който не може да бъде възстановена оригиналната информация, може да се третира като унищожено доказателство.

Мащабът за споделяне на данни, който прави това спешно

77% седмично споделяне определя обхвата. Служители в различни индустрии – юридически, здравни, финансови услуги, технологии – предават свързано с работата съдържание на инструменти с изкуствен интелект като рутинна част от техния работен процес.

Това съдържание включва:

  • Комуникации и кореспонденция с клиенти
  • Проекти на договори и договорени условия
  • Вътрешни стратегически дискусии и документи за бизнес планиране
  • Финансови прогнози и данни за моделиране
  • Меморандуми за правни изследвания и бележки за стратегията на случая
  • Информация за пациента и клинична документация
  • Досиета на служителите и HR комуникации

Когато една организация внедри постоянна анонимизация като свой контрол на сигурността на AI, всеки документ, който преминава през този контрол в нормалния ход на бизнеса, може да бъде променен по начини, които унищожават неговата доказателствена стойност. Ако някой от тези документи стане релевантен за бъдещи съдебни спорове - което за организации в регулирани индустрии, работещи в мащаб, е почти сигурно за многогодишен период - организацията потенциално е предоставила фалшиви доказателства.

GDPR изискване за обратимост

Регулаторната рамка на Европейския съюз за защита на данните изрично разглежда въпроса за обратимостта в контекста на псевдонимизацията.

Член 4, параграф 5 от GDPR определя псевдонимизацията като „обработка на лични данни по такъв начин, че личните данни вече не могат да бъдат приписвани на конкретен субект на данни без използването на допълнителна информация, при условие че такава допълнителна информация се съхранява отделно и е предмет на технически и организационни мерки, за да се гарантира, че личните данни не се приписват на идентифицирано или идентифицируемо физическо лице“.

Определението изисква "допълнителната информация" - ключът, който позволява повторно приписване - да се поддържа. Псевдонимизираните данни под GDPR са данни, които могат да бъдат повторно идентифицирани с помощта на отделно съхранени ключове. Данни, които не могат да бъдат повторно идентифицирани, не се псевдонимизират съгласно GDPR — те са анонимизирани и разграничението на GDPR има значение за целите на съответствието.

Насоки 05/2022 на Европейския съвет за защита на данните относно използването на псевдонимизация потвърждават, че обратимостта е дефинитивно изискване за псевдонимизация съгласно Регламента. Организациите, които прилагат постоянна еднопосочна анонимизация, не прилагат псевдонимизация, както я дефинира GDPR — те прилагат анонимизация. Последствията за съответствие са различни: псевдонимизираните данни запазват някои задължения по GDPR, докато наистина анонимизираните данни може да попаднат извън обхвата на GDPR, но оперативното разграничение е също толкова важно — псевдонимизираните данни могат да бъдат възстановени за легитимни цели, включително правно откриване, докато трайно анонимизираните данни не могат.

Рамката за злоупотреба с федерални правила

Съгласно Федералните правила за гражданска процедура, страните в съдебния спор имат задължението да пазят документи и електронно съхранена информация, която може да има отношение към очаквано или действително съдебно дело. Това задължение се прилага, когато съдебният спор е разумно очакван, а не когато е заведен съдебен процес.

Правило 37(e) предоставя на съдилищата правомощия да налагат санкции, когато страна не успее да запази електронно съхранена информация, която е трябвало да бъде запазена, и пропускът води до увреждане на друга страна. Санкциите могат да включват:

  • Инструкции за предполагаем неблагоприятен извод (журито е инструктирано да приеме, че унищоженото доказателство би било неблагоприятно за ограбващата страна)
  • Преклузия на доказателства
  • Санкции по казус при особени обстоятелства

Анализът на разрушаването в контекста на постоянната анонимизация работи по следния начин: ако дадена организация използва работен процес с изкуствен интелект, който постоянно анонимизира документи в нормалния ход на бизнеса и тези документи по-късно станат подходящи за съдебни спорове, организацията е променила тези документи по начин, който предотвратява възстановяването на оригиналното им съдържание. Ако модификацията е настъпила след задължението за запазване на прикачените файлове — или ако организацията е знаела или е трябвало да знае, че типът документи, които се анонимизират, може да стане релевантен за разумно очакван съдебен спор — организацията е изправена пред излагане на злоупотреба.

Това не е хипотетично. Организации в индустрии с текущ регулаторен контрол, повтарящи се излагане на съдебни спорове или история на договорни спорове са изправени пред непрекъснато състояние на разумно очакване на съдебни спорове за широки категории документи. Внедряването на постоянна анонимност в работните потоци на документи без изрязване за потенциално подходящи материали е систематичен риск от разваляне.

Техническото разграничение: Обратимо срещу Необратимо

Техническото разграничение между обратимо и необратимо анонимизиране е архитектурно, а не постепенно.

Необратимата анонимизация (хеширане, постоянна замяна, разрушителна редакция) трансформира данните по начин, който не може да бъде отменен. SHA-256 хеширането на име на клиент създава хеш с фиксирана дължина, от който името не може да бъде извлечено. Постоянната редакция замества съдържанието по начин, който унищожава основния текст.

Обратима псевдонимизация (замяна на токен със запазване на ключ, AES-256-GCM криптиране) трансформира данните по начин, който може да бъде отменен с помощта на отделно съхранена информация. Име на клиент, заменено със структуриран токен, може да бъде повторно свързано с оригиналното име с помощта на таблица за съпоставяне. AES-256-GCM криптирано съдържание може да бъде декриптирано с помощта на съответния ключ. Оригиналното съдържание остава възстановимо.

За целите на сигурността на AI — предотвратяване на достигането на чувствителни данни до доставчиците на AI в използваема форма — и двата подхода постигат една и съща цел. AI моделът обработва токени или псевдонимизирано съдържание и никога не вижда оригиналните чувствителни данни.

За правно съответствие — запазване на възможността за възстановяване на оригинално съдържание за откриване, регулаторен отговор или законни бизнес цели — само обратимата псевдонимизация е съвместима. Необратимите подходи елиминират способността за възстановяване и създават експозицията на разваляне, описана по-горе.

Съвместимата архитектура

Архитектурата, която се отнася както за сигурността на ИИ, така и за съответствието на откриването, използва обратима псевдонимизация AES-256-GCM:

  1. Документите се обработват преди изпращане към AI инструменти
  2. Чувствителни обекти — имена, номера на сметки, идентификатори, PHI, привилегировано съдържание — се заменят със структурирани токени
  3. Съпоставянето на токена към оригинала се съхранява отделно с контроли за достъп, подходящи за чувствителността на данните
  4. AI обработката се извършва на токенизираната версия — AI моделът никога не получава възстановимо чувствително съдържание
  5. Резултатите се детокенизират с помощта на съхраненото картографиране за законна бизнес употреба
  6. Картографирането подлежи на задържане при съдебен спор, когато са свързани задължения за откриване

При тази архитектура оригиналното съдържание никога не се унищожава. Доставчикът на AI никога не го получава в използваема форма. Съпоставянето на токени запазва възможността за възстановяване на оригинално съдържание, когато това се изисква по закон. Рискът от кражба е елиминиран, тъй като не се унищожават доказателства — само временно се псевдонимизират по обратим начин.

Изискването за псевдонимизация на GDPR съгласно член 4, параграф 5 е изпълнено: допълнителната информация (съпоставяне на токени) се поддържа отделно с подходящи технически и организационни мерки. Изискването за запазване на Федералните правила е изпълнено: оригиналното съдържание може да бъде възстановено, когато се прилага задържане по съдебен спор.

Организациите, прилагащи контроли за сигурност на AI, са изправени пред двоичен избор: постоянно анонимизиране и създаване на риск от откриване или обратимо псевдонимизиране и удовлетворяване едновременно на изискванията за сигурност и съответствие. Средната цена от 2,1 милиона долара за изтичане на AI, която ръководи решението за контрол на сигурността, трябва да бъде претеглена спрямо потенциалната цена на санкциите за разграбване – които в случаи със значителни парични залози могат да достигнат същия или по-голям порядък.

Източници:

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.