anonym.legal

By · Last updated 2026-05-31

Назад към блогаGDPR и съответствие

Отвъд SSN: Анонимизация на вътрешни идентификатори

Всяка организация има вътрешни идентификатори -- ID на служители, номера на сметки, ID на поръчки -- които са лично идентифицируеми в контекст, но се пропускат от стандартните инструменти.

May 31, 20267 мин. четене
custom PII detectionorganizational identifiersre-identification riskGDPR pseudonymizationcustom entity

Отвъд SSN: Анонимизиране на вътрешните идентификатори на вашата организация

Вашият GDPR инструмент премахва имейл адресите. Премахва телефонните номера. Премахва имената. Изпълнявате експорти от поддръжката чрез него. След това споделяте изхода с вашия аналитичен екип.

Номерата на клиентски сметки все още са в всеки тикет. ID на поръчките все още са там. Вътрешните ви потребителски идентификатори също са там.

Тези идентификатори изглеждат безвредни сами по себе си. Без справочна таблица те не назовават лице. Но вашият аналитичен екип има тази таблица. Вашата CRM система я има. Вашата база данни за поддръжка я има. Всеки с достъп може да намери лицето за секунди.

Това е неуспех по GDPR. Инструментът не е сбъркал. Никога не е бил казано да търси вашите идентификатори.

Какво разпознават стандартните PII инструменти

Стандартните PII инструменти покриват универсални формати. Те улавят онова, което използва всяка организация.

Стандартните инструменти разпознават:

  • Номера за социално осигуряване (US SSN, UK NINO, EU национални ID формати)
  • Имейл адреси
  • Телефонни номера
  • Номера на кредитни карти
  • Имена
  • Номера на паспорти и шофьорски книжки

Стандартните инструменти не разпознават:

  • ID на служители във вашия формат EMP-XXXXX
  • Номера на клиентски сметки във вашия формат ACC-XXXXXXXX-XX
  • ID на поръчки във вашия формат ORD-XXXXXXX
  • Вътрешни потребителски ID в UUID или персонализирани формати
  • Специфични за партньори референтни кодове

Стандартните инструменти намират универсални шаблони. Вашите вътрешни идентификатори не са универсални. Те се нуждаят от персонализирана настройка, за да бъдат намерени.

Рискът от повторна идентификация

Фирма експортира тикети за поддръжка за преглед на качеството. Стандартното премахване на PII изтрива имена, имейли и телефонни номера. Номерата на сметки във формат ACC-XXXXXXXX-XX не се засягат.

Експортът отива при аналитичния екип. Анализатор обединява таблицата с тикети с базата данни на клиентите по номер на сметка. Лицето се открива веднага. Не е необходим специален трик. Това е рутинно SQL обединяване.

GDPR Член 4(5) дефинира псевдонимизацията като обработване, при което данните "вече не могат да се приписват на конкретен субект на данни без използването на допълнителна информация". Номерата на сметки не преминават този тест. Допълнителната информация -- вашата база данни с клиенти -- е точно там, в организацията ви.

"Анонимизираният" експорт не е бил анонимен.

Изграждане на шаблони за персонализирани обекти

Настройването на персонализирани обекти е бързо. Екипите по съответствие могат да го направят без инженерна помощ.

Стъпка 1: Изброете вашите ID формати.

Запишете всеки. Например: сметка ACC-XXXXXXXX-XX, ID на поръчка ORD-XXXXXXX, ID на служител EMP-XXXXX.

Стъпка 2: Опишете формата на обикновен език.

"Номерата на сметки започват с ACC, после тире, после 8 цифри, после тире, после 2 главни букви."

AI-подпомоганото генериране на шаблони връща: ACC-\d{8}-[A-Z]{2}

Стъпка 3: Тестайте върху примерни данни.

Качете 20 до 30 документа. Потвърдете, че всички екземпляри са намерени. Потвърдете, че не се появяват фалшиви попадения.

Стъпка 4: Изберете метод.

За идентификатори, използвани като ключове за обединяване, при които анализът трябва да свързва записи:

  • Псевдонимизирайте. Заменете ACC-00123456-AB с ACC-99876543-XY всеки път. Един и същи вход винаги дава един и същи изход. Обединенията продължават да работят. Оригиналната стойност не може да бъде намерена без ключа.

За идентификатори, непотребни в анализа:

  • Редактирайте. Заменете с [REDACTED]. Просто. Постоянно.

Стъпка 5: Запазете като споделена предварителна настройка.

Запазете персонализирания обект -- или набор от тях -- в споделена предварителна настройка. Настройката се прилага за всички употреби: пакетни качвания, API извиквания, браузър интерфейс. Новите членове на екипа получават пълната конфигурация веднага.

Казус: 180 000 тикета за поддръжка

Фирма е намерила 180 000 тикета за поддръжка в аналитичното си хранилище. Имената и имейлите са премахнати. Номерата на сметките не са. Всеки тикет все още съдържа активна стойност ACC-XXXXXXXX-XX.

График за разрешаване:

  1. Служителят по съответствие дефинира ACC шаблона -- 15 минути
  2. Тества го върху 30 примерни тикета -- 20 минути
  3. Потвърждава точността -- 10 минути
  4. Обработва 180 000 тикета в нощен пакетен режим
  5. Заменя таблиците в хранилището с чисти версии

Общо време за служителя по съответствие: 45 минути. Без поддръжка за персонализирани обекти, поправката би изисквала инженерен тикет, преглед на код и деплойване. Това отнема седмици, не часове.

За по-задълбочен поглед върху начина, по който персонализираните ID създават риск в AI инструментите за поддръжка, вижте ръководството за GDPR и AI за поддръжка.

Къде се разпространяват персонализираните идентификатори

Вътрешните идентификатори се появяват на повече места, отколкото повечето екипи очакват.

Вътрешни документи:

  • Бележки от срещи с референции към сметки или поръчки
  • Имейл нишки по клиентски случаи
  • Презентации с данни от казуси

Споделени с трети страни:

  • Доклади до регулатори с референтни номера на случаи
  • Одитни файлове с клиентски референции
  • Файлове на доставчици, съдържащи клиентски идентификатори

Изследвания и анализи:

  • Набори от данни за пътя на клиента
  • Експорти за преглед на качеството на поддръжката
  • Данни за обучение на вътрешни ML модели

Всеки контекст се нуждае от същата настройка на персонализирани обекти, за да се получи наистина анонимен изход.

Псевдонимизация срещу анонимизация

GDPR прави ясна граница.

Псевдонимизацията заменя идентификаторите с заместители. Оригиналното лице може да бъде намерено отново, ако някой има справочната таблица. Тези данни все още са лични данни. Намалява риска. Не премахва задълженията ви по GDPR.

Анонимизацията премахва способността за повторна идентификация. Анонимните данни не са лични данни. GDPR не се прилага за тях.

Номерата на сметки и ID на поръчки са псевдонимни, когато съществуват справочни таблици. Замяната им с фиксирани заместители намалява риска, но GDPR все пак се прилага. Замяната им с случайни токени -- и изтриването на ключа -- премахва задължението по GDPR, но нарушава анализа на базата на обединяване.

За споделяне с трети страни, нямащи вашите справочни таблици: псевдонимизацията може да е достатъчна. За вътрешен анализ са необходими пълна анонимизация или строг контрол на достъпа. Ръководството за правно съответствие обхваща как да документирате всеки подход за вашата ROPA.

Заключение

Пропастта не е неуспех на инструмента. Тя е пропаст в настройката. Никой инструмент не може да знае формата на вашия номер на сметка, освен ако не му кажете.

Настройването на персонализирани обекти затваря пропастта за часове. Екипите по съответствие дефинират форматите, тестват ги върху примерни данни и ги прилагат в всички режими на употреба. Не е необходима инженерна помощ.

180-те хиляди нередактирани номера на сметки не са там, защото инструментът е сбъркал. Те са там, защото на инструмента никога не е казано да ги търси.

Източници

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.