Za rámec rodných čísel a e-mailových adres: Anonymizace vlastních identifikátorů vaší organizace
Váš GDPR anonymizační nástroj detekuje e-mailové adresy. Detekuje telefonní čísla. Detekuje jména a rodná čísla. Ale v zákaznickém lístku je „ID zákazníka CUST-8847291" viditelné pro každého agenta a každý systém, který lístek zpracovává.
To ID zákazníka je osobně identifikovatelné. V kombinaci s vaší CRM databází mapuje na konkrétní fyzickou osobu: jméno, e-mail, adresa, historii nákupů. Je to pseudonym — a pseudonymy jsou osobními daty pod GDPR, dokud je mapovací klíč dostupný.
Standardní PII nástroje přehlíží vlastní organizační identifikátory. Toto jsou osobní data, na která váš vlastní nástroj nevidí.
Kategorie vlastních identifikátorů
Zákaznické identifikátory:
- ID zákazníka: CUST-8847291 nebo C8847291 nebo 8847291
- Číslo účtu: ACC-EU-44291 nebo EUR-44291
- ID zákazníka: CUSTOMER_047291 (interní databázový klíč)
Transakční identifikátory:
- ID objednávky: ORD-2024-119847 nebo O2024119847
- ID lístku: TKT-0047291 nebo TICKET-47291 nebo #47291
- ID transakce: TXN-20240315-8847291
- ID faktury: INV-2024-00847
Zaměstnanecké identifikátory:
- ID zaměstnance: EMP-8847291 nebo E8847 nebo 8847 (HR databáze klíče)
- ID výplatní pásky: PAY-2024-8847291
- Zaměstnec číslo: 88471 (v mzdovém systému)
Produktové/servisní identifikátory:
- ID zařízení přiřazeného zákazníkovi: DEVICE-8847291
- Licenční klíč: PROD-XXXXXXXX-XXXX-XXXX (může být vázán na konkrétní osobu)
Konfigurace vlastní detekce entit
Existující nástroje jako Presidio podporují konfiguraci vlastních rekognizérů pomocí vzorů regulárních výrazů:
from presidio_analyzer import Pattern, PatternRecognizer
# ID zákazníka rekognizér
customer_id_pattern = Pattern(
name="customer_id",
regex=r"CUST-[0-9]{7}",
score=0.9
)
customer_id_recognizer = PatternRecognizer(
supported_entity="CUSTOMER_ID",
patterns=[customer_id_pattern],
context=["customer", "zákazník", "client"]
)
# ID objednávky rekognizér
order_id_pattern = Pattern(
name="order_id",
regex=r"ORD-[0-9]{4}-[0-9]{6}",
score=0.9
)
order_id_recognizer = PatternRecognizer(
supported_entity="ORDER_ID",
patterns=[order_id_pattern]
)
S těmito rekognizéry nakonfigurovanými, zákaznická zpráva:
„Zákazník CUST-8847291 uvádí, že objednávka ORD-2024-119847 nebyla doručena"
se stane:
„Zákazník [CUSTOMER_ID] uvádí, že objednávka [ORDER_ID] nebyla doručena"
Obchodní případ pro kompletní anonymizaci identifikátoru
Platforma zákaznické podpory AI: Lístky zákaznické podpory odeslané na AI platformu (ChatGPT, Claude, vlastní LLM) pro generování odpovědí. Bez anonymizace vlastního identifikátoru: kompletní zákaznické ID, ID objednávky a ID lístků jsou odeslány na třetí stranu AI servery. S anonymizací: AI obdrží kontextový popis bez identifikovatelných odkazů na zákazníka.
Interní analytika a přehledy: Obchodní zpravodajské přehledy sdílené napříč odděleními mohou obsahovat ID zákazníků, která jsou identifikovatelná IT týmu. Anonymizace interních přehledů zabraňuje zbytečnému sdílení zákaznických identifikátorů přes hranice oddělení.
Protokoly třetích stran: Systémové protokoly sdílené s prodejci softwaru pro debugování mohou obsahovat ID zákazníků. Anonymizace protokolů před sdílením s externími prodejci je požadavek článku 28 GDPR.
Zdroje: