Zpět na blogGDPR a shoda

Za rámec rodných čísel a e-mailových adres...

Každá organizace má interní identifikátory — ID zaměstnanců, čísla účtů, ID objednávek — které jsou osobně identifikovatelné v kontextu...

April 20, 20267 min čtení
custom PII detectionorganizational identifiersre-identification riskGDPR pseudonymizationcustom entity

Za rámec rodných čísel a e-mailových adres: Anonymizace vlastních identifikátorů vaší organizace

Váš GDPR anonymizační nástroj detekuje e-mailové adresy. Detekuje telefonní čísla. Detekuje jména a rodná čísla. Ale v zákaznickém lístku je „ID zákazníka CUST-8847291" viditelné pro každého agenta a každý systém, který lístek zpracovává.

To ID zákazníka je osobně identifikovatelné. V kombinaci s vaší CRM databází mapuje na konkrétní fyzickou osobu: jméno, e-mail, adresa, historii nákupů. Je to pseudonym — a pseudonymy jsou osobními daty pod GDPR, dokud je mapovací klíč dostupný.

Standardní PII nástroje přehlíží vlastní organizační identifikátory. Toto jsou osobní data, na která váš vlastní nástroj nevidí.

Kategorie vlastních identifikátorů

Zákaznické identifikátory:

  • ID zákazníka: CUST-8847291 nebo C8847291 nebo 8847291
  • Číslo účtu: ACC-EU-44291 nebo EUR-44291
  • ID zákazníka: CUSTOMER_047291 (interní databázový klíč)

Transakční identifikátory:

  • ID objednávky: ORD-2024-119847 nebo O2024119847
  • ID lístku: TKT-0047291 nebo TICKET-47291 nebo #47291
  • ID transakce: TXN-20240315-8847291
  • ID faktury: INV-2024-00847

Zaměstnanecké identifikátory:

  • ID zaměstnance: EMP-8847291 nebo E8847 nebo 8847 (HR databáze klíče)
  • ID výplatní pásky: PAY-2024-8847291
  • Zaměstnec číslo: 88471 (v mzdovém systému)

Produktové/servisní identifikátory:

  • ID zařízení přiřazeného zákazníkovi: DEVICE-8847291
  • Licenční klíč: PROD-XXXXXXXX-XXXX-XXXX (může být vázán na konkrétní osobu)

Konfigurace vlastní detekce entit

Existující nástroje jako Presidio podporují konfiguraci vlastních rekognizérů pomocí vzorů regulárních výrazů:

from presidio_analyzer import Pattern, PatternRecognizer

# ID zákazníka rekognizér
customer_id_pattern = Pattern(
    name="customer_id",
    regex=r"CUST-[0-9]{7}",
    score=0.9
)

customer_id_recognizer = PatternRecognizer(
    supported_entity="CUSTOMER_ID",
    patterns=[customer_id_pattern],
    context=["customer", "zákazník", "client"]
)

# ID objednávky rekognizér
order_id_pattern = Pattern(
    name="order_id",
    regex=r"ORD-[0-9]{4}-[0-9]{6}",
    score=0.9
)

order_id_recognizer = PatternRecognizer(
    supported_entity="ORDER_ID",
    patterns=[order_id_pattern]
)

S těmito rekognizéry nakonfigurovanými, zákaznická zpráva: „Zákazník CUST-8847291 uvádí, že objednávka ORD-2024-119847 nebyla doručena"

se stane: „Zákazník [CUSTOMER_ID] uvádí, že objednávka [ORDER_ID] nebyla doručena"

Obchodní případ pro kompletní anonymizaci identifikátoru

Platforma zákaznické podpory AI: Lístky zákaznické podpory odeslané na AI platformu (ChatGPT, Claude, vlastní LLM) pro generování odpovědí. Bez anonymizace vlastního identifikátoru: kompletní zákaznické ID, ID objednávky a ID lístků jsou odeslány na třetí stranu AI servery. S anonymizací: AI obdrží kontextový popis bez identifikovatelných odkazů na zákazníka.

Interní analytika a přehledy: Obchodní zpravodajské přehledy sdílené napříč odděleními mohou obsahovat ID zákazníků, která jsou identifikovatelná IT týmu. Anonymizace interních přehledů zabraňuje zbytečnému sdílení zákaznických identifikátorů přes hranice oddělení.

Protokoly třetích stran: Systémové protokoly sdílené s prodejci softwaru pro debugování mohou obsahovat ID zákazníků. Anonymizace protokolů před sdílením s externími prodejci je požadavek článku 28 GDPR.

Zdroje:

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.