Prípad Finančnej Služby: "Máme 184 stĺpcov s 43 000 riadkami klientskych údajov"
Oddielenie Risk & Compliance dostalo GDPR požiadavku na anonimizáciu starej klientskej databázy. Tabuľka na Exceli (áno, Excel – malá väčšina SMB stále používa Excel pre údajové sklady):
Stĺpce zahrňujúce PII:
- customer_id (8 číslic)
- name_full (text)
- email (text)
- phone_personal, phone_work (11-13 číslic)
- ssn (11 znakov)
- card_last_4 (4 znaky)
- home_address (text, 50-100 znakov)
- dob (dátum)
- account_number (text)
- transaction_memos (voľný text – môže obsahovať jakékoľvek PII)
Problém: Jedny redakčný nástroj hovorí: "Detekujem ssn, ale nie je žádny spôsob ako spravovať email v nový stĺpec dohromady." Druhý: "Robím telefónne čísla, ale nie voľný text."
Riešenie: Štruktúrované odhalenie PII s konzistetným pravidlom maskování.