Kaugemal SSN-idest: organisatsiooni sisemiste ID-de anonüümiseerimine

Sinu GDPR-tööriist eemaldab e-posti aadressid. See eemaldab telefoninumbrid. See eemaldab nimed. Sa käivitad läbi selle tugiekspordi. Seejärel jagad väljundit oma analüütikameeskonnaga.

Sinu klientide kontonumbrid on ikka igas piletis. Sinu tellimuste ID-d on ikka seal. Sinu sisemised kasutajate ID-d on seal samuti.

Need ID-d näivad omaette kahjutud. Ilma otsingutabelita ei nimeta need isikut. Kuid sinu analüütikameeskonnal on see tabel. Sinu CRM-il on see. Sinu tugidbaasil on see. Igaüks, kellel on juurdepääs, leiab isiku sekunditega.

See on GDPR-rikkumine. Tööriist ei ebaõnnestunud. Talle lihtsalt ei öeldud, et otsida sinu ID-sid.

Mida standardsed isikuandmete tööriistad tuvastavad

Standardsed isikuandmete tööriistad hõlmavad universaalseid formaate. Nad tuvastavad seda, mida iga organisatsioon kasutab.

Standardsed tööriistad tuvastavad:

Sotsiaalkindlustuse numbrid (USA SSN-id, UK NINO-d, EL-i riiklikud ID-vormingud)
E-posti aadressid
Telefoninumbrid
Krediitkaardi numbrid
Nimed
Passi ja juhiloa numbrid

Standardsed tööriistad ei tuvasta:

Töötajate ID-sid sinu EMP-XXXXX vormingus
Klientide kontonumbreid sinu ACC-XXXXXXXX-XX vormingus
Tellimuste ID-sid sinu ORD-XXXXXXX vormingus
Sisemisi kasutajate ID-sid UUID või kohandatud vormingutes
Partnerite spetsiifilisi viitekoodid

Standardsed tööriistad leiavad universaalseid mustreid. Sinu sisemised ID-d ei ole universaalsed. Nende leidmiseks on vaja kohandatud seadistust.

Taasidentifitseerimise risk

Firma ekspordib tugipileted kvaliteedi ülevaatuseks. Standardne isikuandmete eemaldamine kustutab nimed, e-kirjad ja telefoninumbrid. Kontonumbreid ACC-XXXXXXXX-XX vormingus ei puudutata.

Eksport läheb analüütikameeskonnale. Analüütik ühendab pileti tabeli kliendiandmebaasiga kontonumbri alusel. Isik leitakse kohe. Erilist trikki pole vaja. See on tavaline SQL-liitmine.

GDPR artikkel 4(5) määratleb pseudonüümiseerimise töötlemisena, kus andmeid "ei saa enam konkreetse andmesubjektiga seostada ilma täiendava teabe kasutamiseta". Kontonumbrid ei läbi seda testi. Täiendav teave - sinu kliendiandmebaas - on otse sinu organisatsioonis olemas.

"Anonüümiseeritud" eksport ei olnud anonüümne.

Kohandatud olemimustrite loomine

Kohandatud olemite seadistamine on kiire. Vastavusmeeskonnad saavad seda teha ilma inseneride abita.

Samm 1: Loetle oma ID-vormingud.

Kirjuta iga üks üles. Näiteks: konto ACC-XXXXXXXX-XX, tellimuse ID ORD-XXXXXXX, töötaja ID EMP-XXXXX.

Samm 2: Kirjelda vormingut lihtsas keeles.

"Kontonumbrid algavad ACC-iga, seejärel sidekriips, seejärel 8 numbrit, seejärel sidekriips, seejärel 2 suurtähte."

AI-põhine mustri genereerimine tagastab: ACC-\d{8}-[A-Z]{2}

Samm 3: Testi näidisandmetel.

Laadi üles 20-30 dokumenti. Kinnita, et kõik eksemplarid on leitud. Kinnita, et valepositiivseid pole.

Samm 4: Vali meetod.

ID-de jaoks, mida kasutatakse liitmise võtmetena, kus analüüs vajab kirjete linkimist:

Pseudonüümiseeri. Asenda ACC-00123456-AB alati ACC-99876543-XY-ga. Sama sisend annab alati sama väljundi. Liitmised töötavad ikka. Algset väärtust ei saa leida ilma võtmeta.

ID-de jaoks, mida analüüsis pole vaja:

Redakteeri. Asenda [REDACTED]-iga. Lihtne. Püsiv.

Samm 5: Salvesta jagatud eelseadistusena.

Salvesta kohandatud olem - või komplekt neist - jagatud eelseadistusena. Seadistus kehtib kõikidele kasutusviisidele: pakktöötluse üleslaadimine, API-kõned, brauseri liides. Uued meeskonnaliikmed saavad täieliku konfiguratsiooni kohe.

Juhtumiuuring: 180 000 tugipilefit

Firma leidis oma analüütika laohoonest 180 000 tugipiletti. Nimed ja e-kirjad olid eemaldatud. Kontonumbreid polnud. Iga pilet sisaldas ikka elavat ACC-XXXXXXXX-XX väärtust.

Lahenduse ajakava:

Vastavusametnik määratleb ACC-mustri - 15 minutit
Testib seda 30 näidispiletil - 20 minutit
Kinnitab täpsuse - 10 minutit
Töötleb 180 000 piletit üleöise pakkina
Asendab laohoonetabelid puhta versiooniga

Koguaeg vastamusametnikule: 45 minutit. Ilma kohandatud olemite toeta oleks parandus nõudnud inseneritöö piletit, koodi ülevaatust ja juurutamist. See võtab nädalaid, mitte tunde.

Täpsema pilgu saamiseks, kuidas kohandatud ID-d tekitavad riski AI-tugitoolides, vaata GDPR ja tugiteenuste AI juhend.

Kus kohandatud ID-d levivad

Sisemised ID-d esinevad rohkemates kohtades, kui enamik meeskondi ootab.

Sisedokumendid:

Koosoleku märkmed konto- või tellimuse ID viidetega
E-posti lõimed kliendikaasuste kohta
Esitlused juhtumianalüüsi andmetega

Kolmandate osapooltega jagamine:

Aruanded regulaatoritele juhtumi viitenumbritega
Auditi failid klientide viidetega
Tarnija failid, mis kannavad klientide ID-sid

Uurimine ja analüütika:

Kliendi teekonna andmestikud
Tugiteenuste kvaliteedi ülevaatuse ekspordid
Treeningandmed sisemistele ML-mudelitele

Iga kontekst vajab sama kohandatud olemite seadistust, et toota tõeliselt anonüümset väljundit.

Pseudonüümiseerimine vs. anonüümiseerimine

GDPR tõmbab selge joone.

Pseudonüümiseerimine asendab ID-d asendajatega. Algset isikut saab leida uuesti, kui kellelgi on otsingutabel. Need andmed on ikka isikuandmed. See vähendab riski. See ei eemalda sinu GDPR-kohustusi.

Anonüümiseerimine eemaldab võime taasidentifitseerida. Anonüümsed andmed ei ole isikuandmed. GDPR ei kehti nende suhtes.

Kontonumbrid ja tellimuste ID-d on pseudonüümsed, kui otsingutabelid eksisteerivad. Nende asendamine fikseeritud asendajatega alandab riski, kuid GDPR kehtib ikka. Nende asendamine juhuslike märkidega - ja võtme kustutamine - eemaldab GDPR-kohustuse, kuid katkestab liitmisel põhineva analüüsi.

Kolmandate osapooltega jagamiseks, kellel pole sinu otsingutabeleid: pseudonüümiseerimine võib olla piisav. Sisemiseks analüütikaks on vaja täielikku anonüümiseerimist või ranget juurdepääsukontrolli. Õigusliku vastavuse juhend käsitleb seda, kuidas iga lähenemist oma ROPA jaoks dokumenteerida.

Kokkuvõte

Lünk ei ole tööriista tõrge. See on seadistuse lünk. Ükski tööriist ei suuda teada sinu kontonumbri vormingut, kui sa talle seda ei ütle.

Kohandatud olemite seadistamine sulgeb lünga tundidega. Vastavusmeeskonnad määratlevad vormingud, testavad neid näidisandmetel ja rakendavad neid kõigil kasutusviisidel. Inseneride abi pole vaja.

180 000 redakteerimata kontonumbrit polnud seal seetõttu, et tööriist ebaõnnestus. Need olid seal seetõttu, et tööriistale ei öeldud neid otsida.

Allikad

Seotud Artiklid

GDPR ja Vastavus

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.

Alusta Tasuta Katset Vaata Funktsioone

Kaugemal SSN-idest: organisatsiooni sisemiste ID-de anonüümiseerimine