Preko SSN-jev: Anonimizacija internih ID-jev vase organizacije
Vase orodje GDPR odstrani e-postne naslove. Odstrani telefonske stevilke. Odstrani imena. Skozi njega zazenete izvoze podpore. Nato delite izhod s svojo analitsko ekipo.
Stevilke racunov vasih strank so se v vsaki vstopnici. ID-ji vasih narocil so se tam. Notranji ID-ji vasih uporabnikov so prav tako se tam.
Ti ID-ji sami po sebi izgledajo nenevarne. Brez iskalne tabele ne imenujejo osebe. Toda vasa analitska ekipa ima to tabelo. Vase CRM jo ima. Vasa podatkovna baza podpore jo ima. Kdorkoli z dostopom lahko v sekundah najde osebo.
To je napaka GDPR. Orodje se ni pokvarilo. Nikoli mu ni bilo naroceno, da isce vase ID-je.
Kaj standardna orodja za osebne podatke zaznajo
Standardna orodja za osebne podatke pokrijejo univerzalne formate. Ujamejo, kar vsaka organizacija uporablja.
Standardna orodja zaznajo:
- Stevilke socialnega zavarovanja (SSN-ji ZDA, NINO-ji UK, formati nacionalnih ID-jev EU)
- E-postne naslove
- Telefonske stevilke
- Stevilke kreditnih kartic
- Imena
- Stevilke potnih listov in vozniskih dovoljenj
Standardna orodja ne zaznajo:
- ID-jev zaposlenih v vasem formatu EMP-XXXXX
- Stevilk racunov strank v vasem formatu ACC-XXXXXXXX-XX
- ID-jev narocil v vasem formatu ORD-XXXXXXX
- Notranjih ID-jev uporabnikov v UUID ali prilagojenih formatih
- Partnersko specificnih referenCnih kod
Standardna orodja najdejo univerzalne vzorce. Vasi notranji ID-ji niso univerzalni. Potrebujejo prilagojeno nastavitev, da se jih najde.
Tveganje ponovne identifikacije
Podjetje izvozi vstopnice za podporo za pregled kakovosti. Standardno odstranjevanje osebnih podatkov odstrani imena, e-poste in telefonske stevilke. Stevilke racunov v formatu ACC-XXXXXXXX-XX niso dotaknjena.
Izvoz gre analitski ekipi. Analitik zdruzi tabelo vstopnic z bazo podatkov strank glede na stevilko racuna. Oseba je takoj najdena. Noben poseben trik ni potreben. Je rutinska poizvedba SQL.
Clen 4(5) GDPR definira psevdonimizacijo kot obdelavo, kjer podatki "ne morejo biti vec pripisani dolocenemu posamezniku brez uporabe dodatnih informacij." Stevilke racunov ne prestanejo tega preizkusa. Dodatne informacije - vasa baza podatkov strank - so ravno tam v vasi organizaciji.
"Anonimizirani" izvoz ni bil anonimen.
Gradnja vzorcev entitet po meri
Navastitev entitet po meri je hitra. Ekipe za skladnost jo lahko naredijo brez pomoci inzenirjev.
Korak 1: Navedite svoje formate ID-jev.
Zapisite vsakega. Na primer: racun ACC-XXXXXXXX-XX, ID narocila ORD-XXXXXXX, ID zaposlenega EMP-XXXXX.
Korak 2: Opisite format v preprostem jeziku.
"Stevilke racunov se zacnejo z ACC, nato pomisljaj, nato 8 stevilk, nato pomisljaj, nato 2 veliki crhki."
Generiranje vzorcev s pomocjo UI vrne: ACC-\d{8}-[A-Z]{2}
Korak 3: Preizkusite na vzorcnih podatkih.
Nalozite 20 do 30 dokumentov. Potrdite, da so najdeni vsi primeri. Potrdite, da ni laznih zadetkov.
Korak 4: Izberite metodo.
Za ID-je, ki se uporabljajo kot kljuci za zdruzevanje, kjer analiza mora povezati evidence:
- Psevdonimizirajte. Zamenjajte ACC-00123456-AB z ACC-99876543-XY vsakic. Isti vhod vedno da isti izhod. Zdruzevanja se vedno delujejo. Prvotna vrednost ne more biti najdena brez kljuca.
Za ID-je, ki niso potrebni v analizi:
- Redigirajte. Zamenjajte z [REDACTED]. Enostavno. Trajno.
Korak 5: Shranite kot skupno prednastavitev.
Shranite entiteto po meri - ali skupek njih - v skupno prednastavitev. Nastavitev se uporabi za vso uporabo: paketne nalozitve, klice API-ja, brskalniski vmesnik. Novi clani ekipe takoj dobijo celotno konfiguracijo.
Studija primera: 180.000 vstopnic za podporo
Podjetje je naslo 180.000 vstopnic za podporo v svoji analitski podatkovni skladsnici. Imena in e-poste so bile odstranjene. Stevilke racunov niso bile. Vsaka vstopnica je se vedno imela zivo vrednost ACC-XXXXXXXX-XX.
Casovnica resitve:
- Uradnik za skladnost definira vzorec ACC - 15 minut
- Preizkusi ga na 30 vzorcnih vstopnicah - 20 minut
- Potrdi natancnost - 10 minut
- Obdela 180.000 vstopnic v nocnem paketnem nacinu
- Zamenja tabele v podatkovni skladsnici s cistimi razlicicami
Skupni cas za uradnika za skladnost: 45 minut. Brez podpore entitet po meri bi resitev zahtevala inzinirsko vstopnico, pregled kode in uvedbo. To vzame tedne, ne ure.
Za bolj podroben pogled na to, kako notranji ID-ji ustvarjajo tveganje v orodjih UI za podporo, glejte vodic za GDPR in AI podporo.
Kje se sirijo notranji ID-ji
Notranji ID-ji se pojavljajo na vec mestih, kot vecina ekip pricakuje.
Notranji dokumenti:
- Zapiski sestankov s sklici na stevilke racunov ali narocil
- E-postna sporocila o primerih strank
- Predstavitve s podatki studij primerov
V skupni rabi s tretjimi strankami:
- Porocila regulatorjem s stevilkami referenc primerov
- Revizijske datoteke s sklici na stranke
- Datoteke prodajalcev, ki nosijo ID-je strank
Raziskave in analitika:
- Nabori podatkov o potovanju stranke
- Izvozi pregleda kakovosti podpore
- Ucni podatki za notranje modele ML
Vsak kontekst potrebuje enako nastavitev entitet po meri za proizvodnjo resniono anonimnega izhoda.
Psevdonimizacija vs. Anonimizacija
GDPR vleece jasno crto.
Psevdonimizacija zamenja ID-je z nadomestki. Prvotno osebo je mogoce najti znova, ce nekdo ima iskalno tabelo. Ti podatki so se vedno osebni podatki. Zmanjsuje tveganje. Ne odstrani vasih obveznosti GDPR.
Anonimizacija odstrani moznost ponovne identifikacije. Anonimni podatki niso osebni podatki. GDPR zanje ne velja.
Stevilke racunov in ID-ji narocil so psevdonimni, ko obstajajo iskalne tabele. Zamenjava z utezjenimi nadomestki zmanjsuje tveganje, toda GDPR se vedno velja. Zamenjava z nakljucnimi znackami - in brisanje kljuca - odstrani dolznost GDPR, toda pokvari analizo na podlagi zdruzevanja.
Za deljenje s tretjimi strankami, ki nimajo vasiH iskalnih tabel: psevdonimizacija je morda dovolj. Za notranjo analitiko so potrebna polna anonimizacija ali strogi nadzori dostopa. Vodic za pravno skladnost pokriva, kako dokumentirati vsak pristop za vase ROPA.
Zakljucek
Vrzel ni napaka orodja. Je vrzel v nastavitvi. Nobeno orodje ne more poznati formata vasih stevilk racunov, ce mu ne poveste.
Nastavitev entitet po meri zapre vrzel v urah. Ekipe za skladnost definirajo formate, jih preizkusijo na vzorcnih podatkih in jih uporabijo v vseh naciniH uporabe. Pomoc inzenirjev ni potrebna.
180.000 neredigiranih stevilk racunov ni bilo tam, ker je orodje odpovedalo. Bili so tam, ker orodju nikoli ni bilo naroceno, da jih isce.