anonym.legal

By · Last updated 2026-03-15

Назад към блогаПравни технологии

Постоянната анонимизация: риск от унищожаване на доказателства

34,8% от входните данни в ChatGPT съдържат чувствителни данни (Cyberhaven). Решението -- постоянната анонимизация -- създава собствен правен риск: унищожаване на доказателства. Член 4(5) от GDPR изисква обратимост.

March 15, 202610 мин. четене
reversible encryptionspoliation risklegal discovery complianceGDPR pseudonymizationAES-256-GCM

Актуализирано за 2026 г.

Едно решение, два нови риска

Много фирми вече блокират изтичането чрез AI, като премахват имена и идентификатори, преди текстът да достигне до AI доставчик. Еднопосочното хеширане, твърдата редакция или пълното премахване изглеждат безопасни. AI получава чист текст. Чувствителните детайли остават вътре в компанията.

Логиката е издържана откъм сигурност. Проучването на Cyberhaven за Q4 2025 установи, че 34,8% от съдържанието, изпратено до ChatGPT, съдържа чувствителни данни. Докладът на Ponemon за 2024 г. постави средната цена на пробив чрез AI на 2,1 милиона долара. Рискът е реален и цената е висока.

Но пълното премахване заменя един риск с друг: унищожаване на доказателства.

За фирми, подлежащи на съдебни дела или одити, унищожаването на способността за възстановяване на необработените записи може да се счита за унищожаване на доказателства по федерални и щатски правила.

Мащабът на споделянето чрез AI

Проучване на eSecurity Planet и Cyberhaven установи, че 77% от персонала споделя чувствителни данни с AI инструменти всяка седмица. Това обхваща правната, здравната, финансовата и технологичната сфера.

Споделяното съдържание включва:

  • Клиентски писма и бележки по делото
  • Проекти на договори и условия на сделки
  • Вътрешни планове и бизнес записи
  • Финансови модели и прогнози
  • Правни меморандуми и бележки по делото
  • Пациентски досиета и клинични бележки
  • HR файлове и служебни съобщения

Когато пълното премахване е контролът за AI, всеки документ, преминаващ през него, може да загуби своята правна стойност. Ако тези документи се появят в съдебно дело -- много вероятно за период от много години за фирми в регулирани области -- фирмата потенциално е загубила доказателства.

Вижте нашия преглед на правното съответствие за това как anonym.legal изпълнява задълженията при разкриване. Можете също да прегледате ръководството за токен системата, за да видите как работи конвейерът за маскиране на практика.

GDPR: Обратимостта е задължителна

Член 4(5) от GDPR определя псевдонимизацията като обработка на лични данни по начин, при който те "не могат вече да бъдат свързани с конкретно физическо лице без използването на допълнителна информация, при условие че тази допълнителна информация се съхранява отделно".

Ключовият момент: допълнителният ключ, позволяващ повторно свързване, трябва да бъде запазен. Записи, които могат да бъдат повторно свързани чрез съхранени ключове, се считат за псевдонимизирани по GDPR.

Записи, които изобщо не могат да бъдат повторно свързани, не са псевдонимизирани. Те са анонимизирани. Разликата е важна:

  • Маскираните с токени записи запазват някои задължения по GDPR, но могат да бъдат възстановени за правна употреба.
  • Напълно изтритите записи може да излязат извън обхвата на GDPR, но изобщо не могат да бъдат възстановени.

Насоките 05/2022 на Европейския комитет по защита на данните потвърждават, че обратимостта е основна част от определението. Фирмите, използващи еднопосочно премахване, не извършват GDPR псевдонимизация. Те премахват способността за възстановяване на записи.

Научете повече в нашия хъб за съответствие и преглед на защитата.

Федерални правила: Тестът за унищожаване на доказателства

Според Федералните процесуални правила страните трябва да запазват записи, които може да са относими към очаквани правни действия. Това задължение започва, когато съдебният иск е разумно предвидим -- а не когато е подаден.

Правило 37(е) позволява на съдилищата да налагат наказания, когато страна не успее да запази съхранявани записи. Наказанията могат да включват:

  • Инструкции за неблагоприятно заключение
  • Изключване на доказателства
  • Санкции, прекратяващи делото, в сериозни случаи

Ето как се развива това. Фирма използва AI работни потоци, напълно премахващи чувствително съдържание в обичайния ход на бизнеса. Тези записи по-късно стават относими за съдебно дело. Фирмата ги е изменила така, че необработеният текст не може да бъде възстановен. Ако това е станало след прикрепването на задължението за запазване, следва излагане на унищожаване на доказателства.

Това не е маргинален случай. Фирмите в регулирани области с повтаряща се правна експозиция са изправени пред постоянно предвидими съдебни дела за широк спектър от видове документи. Внедряването на пълно премахване при всички работни потоци -- без изключения за документи под риск -- създава значителен риск от унищожаване на доказателства.

Обратима срещу необратима: ключовата разлика

Разликата между обратимото и еднопосочното маскиране е в дизайна.

Еднопосочно: няма път назад

SHA-256 хеширането на дадено имe произвежда фиксиран хеш. Името не може да бъде изведено от него. Твърдата редакция премахва текста, така че необработеното съдържание изчезва.

Обратимо: възстановяването е възможно

Заместването с токени при запазване на ключ и криптирането AES-256-GCM трансформират записите по начини, които могат да бъдат отменени. Дадено имe, заменено с токен, може да бъде възстановено чрез таблица за търсене. Съдържанието, криптирано с AES-256-GCM, може да бъде декриптирано с правилния ключ. Необработеният текст остава достъпен.

За защита на AI и двата метода работят по един и същи начин. AI обработва токени и никога не вижда реалните записи.

За правно задължение работи само обратимото маскиране с токени. Еднопосочните методи прекъсват възстановяването и създават риска от унищожаване на доказателства, посочен по-горе.

Прочетете как нашата токен система се справя с това от край до край. За по-задълбочен контекст вижте речника и FAQ.

Дизайнът, отговарящ на двете изисквания

Дизайн, отговарящ едновременно на изискванията за сигурност на AI и за правно разкриване, използва обратимо маскиране с токени AES-256-GCM:

  1. Записите се обработват, преди да достигнат до какъвто и да е AI инструмент.
  2. Чувствителни елементи -- имена, идентификатори, PHI, привилегировано съдържание -- се заменят с структурирани токени.
  3. Картата на токените се съхранява в отделно хранилище с контроли за достъп, съответстващи на вида данни.
  4. AI обработката се изпълнява върху копието с токени. AI никога не вижда реалните записи.
  5. Резултатите се възстановяват с помощта на картата на токените за обичайна бизнес употреба.
  6. Картата на токените се поставя под правно задължение за запазване, когато се прикрепват задълженията за разкриване.

При този дизайн не се губи необработено съдържание. AI доставчикът никога не го вижда в използваем вид. Картата на токените запазва възможността за възстановяване, когато законът го изисква. Рискът от унищожаване на доказателства изчезва -- никакви записи не се унищожават. Те са само маскирани по начин, който може да бъде отменен.

Член 4(5) от GDPR е изпълнен: допълнителният ключ (картата на токените) се съхранява отделно с правилните технически и процесуални гаранции. Задължението за запазване по Федералните правила е изпълнено: необработените записи могат да бъдат възстановени, когато се прилага правно задължение за запазване.

Проучете нашия подход за разпознаване на обекти, преглед на защитата и планове и тарифи за пълни детайли.

Двоичният избор

Фирмите са изправени пред ясно разклонение:

  • Постоянно премахване на данните -- решава проблема с изтичането чрез AI, но създава правен риск.
  • Използване на обратимо маскиране с токени -- едновременно отговаря на нуждите за защита и съответствие.

Средната цена на пробив чрез AI от 2,1 милиона долара движи решението за сигурност. Но санкциите за унищожаване на доказателства също не са евтини. В дела с голям паричен интерес разходите могат да достигнат един и същи порядък на величина. И двата риска заслужават място в решението.

Съответната AI политика покрива и двата края. Тя блокира чувствителните записи да напускат фирмата в използваем вид. И запазва тези същи записи достъпни, когато съд или регулатор ги поиска. Обратимото маскиране с токени е единственият метод, правещ и двете едновременно.

За повече контекст вижте нашето изявление на основателя и казуси.

Източници

  • Cyberhaven Q4 2025: Излагане на данни в AI инструменти -- линк
  • IBM / Ponemon Institute: Доклад за цената на пробива на данни 2024 -- линк
  • Насоки 05/2022 на EDPB относно псевдонимизацията -- линк
  • Федерални процесуални правила, Правило 37(е) -- линк
  • E-Discovery LLC: Редакции по уместност и правни стандарти -- линк

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.