Kaugemal SSN-idest: organisatsiooni sisemiste ID-de anonüümiseerimine
Sinu GDPR-tööriist eemaldab e-posti aadressid. See eemaldab telefoninumbrid. See eemaldab nimed. Sa käivitad läbi selle tugiekspordi. Seejärel jagad väljundit oma analüütikameeskonnaga.
Sinu klientide kontonumbrid on ikka igas piletis. Sinu tellimuste ID-d on ikka seal. Sinu sisemised kasutajate ID-d on seal samuti.
Need ID-d näivad omaette kahjutud. Ilma otsingutabelita ei nimeta need isikut. Kuid sinu analüütikameeskonnal on see tabel. Sinu CRM-il on see. Sinu tugidbaasil on see. Igaüks, kellel on juurdepääs, leiab isiku sekunditega.
See on GDPR-rikkumine. Tööriist ei ebaõnnestunud. Talle lihtsalt ei öeldud, et otsida sinu ID-sid.
Mida standardsed isikuandmete tööriistad tuvastavad
Standardsed isikuandmete tööriistad hõlmavad universaalseid formaate. Nad tuvastavad seda, mida iga organisatsioon kasutab.
Standardsed tööriistad tuvastavad:
- Sotsiaalkindlustuse numbrid (USA SSN-id, UK NINO-d, EL-i riiklikud ID-vormingud)
- E-posti aadressid
- Telefoninumbrid
- Krediitkaardi numbrid
- Nimed
- Passi ja juhiloa numbrid
Standardsed tööriistad ei tuvasta:
- Töötajate ID-sid sinu EMP-XXXXX vormingus
- Klientide kontonumbreid sinu ACC-XXXXXXXX-XX vormingus
- Tellimuste ID-sid sinu ORD-XXXXXXX vormingus
- Sisemisi kasutajate ID-sid UUID või kohandatud vormingutes
- Partnerite spetsiifilisi viitekoodid
Standardsed tööriistad leiavad universaalseid mustreid. Sinu sisemised ID-d ei ole universaalsed. Nende leidmiseks on vaja kohandatud seadistust.
Taasidentifitseerimise risk
Firma ekspordib tugipileted kvaliteedi ülevaatuseks. Standardne isikuandmete eemaldamine kustutab nimed, e-kirjad ja telefoninumbrid. Kontonumbreid ACC-XXXXXXXX-XX vormingus ei puudutata.
Eksport läheb analüütikameeskonnale. Analüütik ühendab pileti tabeli kliendiandmebaasiga kontonumbri alusel. Isik leitakse kohe. Erilist trikki pole vaja. See on tavaline SQL-liitmine.
GDPR artikkel 4(5) määratleb pseudonüümiseerimise töötlemisena, kus andmeid "ei saa enam konkreetse andmesubjektiga seostada ilma täiendava teabe kasutamiseta". Kontonumbrid ei läbi seda testi. Täiendav teave - sinu kliendiandmebaas - on otse sinu organisatsioonis olemas.
"Anonüümiseeritud" eksport ei olnud anonüümne.
Kohandatud olemimustrite loomine
Kohandatud olemite seadistamine on kiire. Vastavusmeeskonnad saavad seda teha ilma inseneride abita.
Samm 1: Loetle oma ID-vormingud.
Kirjuta iga üks üles. Näiteks: konto ACC-XXXXXXXX-XX, tellimuse ID ORD-XXXXXXX, töötaja ID EMP-XXXXX.
Samm 2: Kirjelda vormingut lihtsas keeles.
"Kontonumbrid algavad ACC-iga, seejärel sidekriips, seejärel 8 numbrit, seejärel sidekriips, seejärel 2 suurtähte."
AI-põhine mustri genereerimine tagastab: ACC-\d{8}-[A-Z]{2}
Samm 3: Testi näidisandmetel.
Laadi üles 20-30 dokumenti. Kinnita, et kõik eksemplarid on leitud. Kinnita, et valepositiivseid pole.
Samm 4: Vali meetod.
ID-de jaoks, mida kasutatakse liitmise võtmetena, kus analüüs vajab kirjete linkimist:
- Pseudonüümiseeri. Asenda ACC-00123456-AB alati ACC-99876543-XY-ga. Sama sisend annab alati sama väljundi. Liitmised töötavad ikka. Algset väärtust ei saa leida ilma võtmeta.
ID-de jaoks, mida analüüsis pole vaja:
- Redakteeri. Asenda [REDACTED]-iga. Lihtne. Püsiv.
Samm 5: Salvesta jagatud eelseadistusena.
Salvesta kohandatud olem - või komplekt neist - jagatud eelseadistusena. Seadistus kehtib kõikidele kasutusviisidele: pakktöötluse üleslaadimine, API-kõned, brauseri liides. Uued meeskonnaliikmed saavad täieliku konfiguratsiooni kohe.
Juhtumiuuring: 180 000 tugipilefit
Firma leidis oma analüütika laohoonest 180 000 tugipiletti. Nimed ja e-kirjad olid eemaldatud. Kontonumbreid polnud. Iga pilet sisaldas ikka elavat ACC-XXXXXXXX-XX väärtust.
Lahenduse ajakava:
- Vastavusametnik määratleb ACC-mustri - 15 minutit
- Testib seda 30 näidispiletil - 20 minutit
- Kinnitab täpsuse - 10 minutit
- Töötleb 180 000 piletit üleöise pakkina
- Asendab laohoonetabelid puhta versiooniga
Koguaeg vastamusametnikule: 45 minutit. Ilma kohandatud olemite toeta oleks parandus nõudnud inseneritöö piletit, koodi ülevaatust ja juurutamist. See võtab nädalaid, mitte tunde.
Täpsema pilgu saamiseks, kuidas kohandatud ID-d tekitavad riski AI-tugitoolides, vaata GDPR ja tugiteenuste AI juhend.
Kus kohandatud ID-d levivad
Sisemised ID-d esinevad rohkemates kohtades, kui enamik meeskondi ootab.
Sisedokumendid:
- Koosoleku märkmed konto- või tellimuse ID viidetega
- E-posti lõimed kliendikaasuste kohta
- Esitlused juhtumianalüüsi andmetega
Kolmandate osapooltega jagamine:
- Aruanded regulaatoritele juhtumi viitenumbritega
- Auditi failid klientide viidetega
- Tarnija failid, mis kannavad klientide ID-sid
Uurimine ja analüütika:
- Kliendi teekonna andmestikud
- Tugiteenuste kvaliteedi ülevaatuse ekspordid
- Treeningandmed sisemistele ML-mudelitele
Iga kontekst vajab sama kohandatud olemite seadistust, et toota tõeliselt anonüümset väljundit.
Pseudonüümiseerimine vs. anonüümiseerimine
GDPR tõmbab selge joone.
Pseudonüümiseerimine asendab ID-d asendajatega. Algset isikut saab leida uuesti, kui kellelgi on otsingutabel. Need andmed on ikka isikuandmed. See vähendab riski. See ei eemalda sinu GDPR-kohustusi.
Anonüümiseerimine eemaldab võime taasidentifitseerida. Anonüümsed andmed ei ole isikuandmed. GDPR ei kehti nende suhtes.
Kontonumbrid ja tellimuste ID-d on pseudonüümsed, kui otsingutabelid eksisteerivad. Nende asendamine fikseeritud asendajatega alandab riski, kuid GDPR kehtib ikka. Nende asendamine juhuslike märkidega - ja võtme kustutamine - eemaldab GDPR-kohustuse, kuid katkestab liitmisel põhineva analüüsi.
Kolmandate osapooltega jagamiseks, kellel pole sinu otsingutabeleid: pseudonüümiseerimine võib olla piisav. Sisemiseks analüütikaks on vaja täielikku anonüümiseerimist või ranget juurdepääsukontrolli. Õigusliku vastavuse juhend käsitleb seda, kuidas iga lähenemist oma ROPA jaoks dokumenteerida.
Kokkuvõte
Lünk ei ole tööriista tõrge. See on seadistuse lünk. Ükski tööriist ei suuda teada sinu kontonumbri vormingut, kui sa talle seda ei ütle.
Kohandatud olemite seadistamine sulgeb lünga tundidega. Vastavusmeeskonnad määratlevad vormingud, testavad neid näidisandmetel ja rakendavad neid kõigil kasutusviisidel. Inseneride abi pole vaja.
180 000 redakteerimata kontonumbrit polnud seal seetõttu, et tööriist ebaõnnestus. Need olid seal seetõttu, et tööriistale ei öeldud neid otsida.