SSNetik Haratago: Zure Erakundearen Barne IDen Anonimizazioa
Zure GDPR tresneak posta elektronikoko helbideak kentzen ditu. Telefono-zenbakiak kentzen ditu. Izenak kentzen ditu. Laguntza-esportazioak bertatik igaro dituzu. Ondoren irteera zure analisi-taldearekin partekatzen duzu.
Zure bezero-kontu-zenbakiak oraindik txartel guztietan daude. Eskaera-IDak oraindik daude. Zure barneko erabiltzaile-IDak ere bertan daude.
ID hauek bakarrik kalterik ez dirudi. Bilaketa-taularik gabe, ez dute pertsona bat izendatzen. Baina zure analisi-taldeak taula hori du. Zure CRMk du. Zure laguntza-datu-baseak du. Sarrera duen edonork pertsonari segundotan aurki diezaioke.
Hau GDPR porrot bat da. Tresnak ez du porrot egin. Inoiz ez zitzaion esan zure IDak bilatzeko.
Tresna Estandarrek Zer Detektatzen Duten
Tresna estandarrek formatu unibertsalak estaltzen dituzte. Erakunde guztiek erabiltzen dutena harrapatzen dute.
Tresna estandarrek detektatzen dituzte:
- Gizarte-segurantza-zenbakiak (AEBetako SSNak, EBetako NINO, EUko nazional ID formatuak)
- Posta elektronikoko helbideak
- Telefono-zenbakiak
- Kreditu-txarteleko zenbakiak
- Izenak
- Pasaporte eta gidabaimena-zenbakiak
Tresna estandarrek ez dituzte detektatzen:
- Langile-IDak zure EMP-XXXXX formatuan
- Bezero-kontu-zenbakiak zure ACC-XXXXXXXX-XX formatuan
- Eskaera-IDak zure ORD-XXXXXXX formatuan
- UUID edo formatu pertsonalizatuko barneko erabiltzaile-IDak
- Lankide-espezifikoko erreferentzia-kodeak
Tresna estandarrek eredu unibertsalak aurkitzen dituzte. Zure barne-IDak ez dira unibertsalak. Aurkitu ahal izateko konfigurazio pertsonalizatua behar dute.
Berridentifikazio-Arriskua
Empresa batek kalitate-berrikuntzarako laguntza-txartelak esportatzen ditu. Tresna estandarrak izenak, emailak eta telefono-zenbakiak kentzen ditu. ACC-XXXXXXXX-XX formatuko kontu-zenbakiak ez dira ukitzen.
Esportazioa analisi-taldearengana doa. Analisi-batek txartel-taula bezero-datu-basearekin kontu-zenbakian elkartzen du. Pertsonari berehala aurkitzen zaio. Ez da truku berezirik behar. Ohiko SQL BATERAKETA bat da.
GDPR 4(5) artikuluak pseudonimizazioa definitzen du datuak prozesatzeko non "dagoeneko ezin den esleitu datu-subjektu zehatz bati informazio osagarririk erabili gabe." Kontu-zenbakiek proba hori gainditzerik ez dute. Informazio osagarria -- zure bezero-datu-basea -- zure erakundean bertan dago.
"Anonimizatutako" esportazioa ez zen anonimoa.
Entitate Eredu Pertsonalizatuak Eraikitzea
Entitate pertsonalizatuen konfigurazioa azkarra da. Betetze-taldeek ingeniaritza-laguntzarik gabe egin dezakete.
1. urratsa: Zerrendatu zure ID formatuak.
Idatzi bakoitza. Adibidez: kontu ACC-XXXXXXXX-XX, eskaera-ID ORD-XXXXXXX, langile-ID EMP-XXXXX.
2. urratsa: Deskribatu formatua hizkuntza arruntean.
"Kontu-zenbakiak ACC-rekin hasten dira, ondoren marratxo bat, ondoren 8 digitu, ondoren marratxo bat, ondoren 2 letra larri."
AI-laguntzako eredu-sorkuntza itzultzen du: ACC-\d{8}-[A-Z]{2}
3. urratsa: Probatu lagin-datuekin.
Igo 20-30 dokumentu. Berretsi kasu guztiak aurkitzen direla. Berretsi sasi-positiborik ez dagoela.
4. urratsa: Aukeratu metodo bat.
Elkartze-gako gisa erabiltzen diren IDengatik, non analisiak erregistroak lotu behar dituen:
- Pseudonimizatu. Ordezkatu ACC-00123456-AB ACC-99876543-XY-rekin aldi guztietan. Sarrera berak beti irteera berdina ematen du. Elkartzeak oraindik funtzionatzen dute. Jatorrizko balioa gako gabe ezin da aurkitu.
Analisian behar ez diren IDengatik:
- Ezabatu. Ordezkatu [REDACTED]-rekin. Erraza. Iraunkorra.
5. urratsa: Aurreslan-plan partekatuaren gisa gorde.
Gorde entitate pertsonalizatua -- edo hauen multzo bat -- aurreslan-plan partekatuaren gisa. Konfigurazioa erabilera guztietan aplikatzen da: batch igoerak, API deialdiak, nabigatzaile-interfazea. Taldekide berriek konfigurazio osoa berehala lortzen dute.
Kasua Azterketa: 180.000 Laguntza-Txartel
Enpresa batek 180.000 laguntza-txartel aurkitu zituen haien analisi-biltegian. Izenak eta emailak kendu ziren. Kontu-zenbakiak ez. Txartel bakoitzak oraindik bizi den ACC-XXXXXXXX-XX balio bat zuen.
Ebazpen-denbora-lerroa:
- Betetze-arduradunak ACC eredua definitu -- 15 minutu
- Probatu 30 lagin-txarteletan -- 20 minutu
- Zehaztasuna berretsi -- 10 minutu
- Prozesatu 180.000 txartelak gau bateko batch-ean
- Ordezkatu biltegi-taulak bertsio garbiekin
Betetze-arduraldunaren guztirako denbora: 45 minutu. Entitate pertsonalizatuen laguntzarik gabe, konponketak ingeniaritza-txartela, kodea berrikustea eta inplementazioa beharko lituzke. Horrek asteak behar ditu, ez orduak.
Pertsonalizatutako IDek AI laguntza-tresnetan nola arriskua sortzen duten gertutik ikusteko, ikusi GDPR eta laguntza AI gida.
Barne IDak Non Hedatzen Diren
Barne IDak gehieneko taldeek espero duten baino leku gehiagotan agertzen dira.
Barne dokumentuak:
- Bilerako oharrak kontu edo eskaera ID erreferentziekin
- Bezero-kasuen inguruko email-hariak
- Kasu-azterketako datuekin aurkezpenak
Hirugarrenekin partekatuta:
- Kasu-erreferentzia-zenbakiekin erregelatzaile-txostenak
- Bezero-erreferentziak dituzten auditoretza-fitxategiak
- Bezero-IDak dakarten hornitzaile-fitxategiak
Ikerketa eta analisia:
- Bezero-bidaia-dataset-ak
- Laguntza-kalitate-berrikuspena esportazioak
- Barneko ML modeloetarako entrenamendu-datuak
Testuinguru bakoitzak konfigurazio berdinaren entitate pertsonalizatua behar du benetako irteeraren anonimoa sortzeko.
Pseudonimizazioa vs. Anonimizazioa
GDPRk lerroa argi markatzen du.
Pseudonimizazioak IDak ordezkariekin ordezkatzen ditu. Jatorrizko pertsona bilaketa-taula duenak berriro aurkitu dezake. Datu hauek oraindik datu pertsonalak dira. Arriskua murrizten du. Ez du zure GDPR betebeharrak kentzen.
Anonimizazioak berridentifikatzeko gaitasuna kentzen du. Datu anonimoak ez dira datu pertsonalak. GDPRa ez zaie aplikatzen.
Kontu-zenbakiak eta eskaera-IDak pseudonimoak dira bilaketa-taulak daudenean. Hauek ordezko finkoetan ordezkatzeak arriskua murrizten du, baina GDPRa oraindik aplikatzen da. Ausazko tokenekin ordezkatzeak -- eta gakoa ezabatuz -- GDPR betebeharra kentzen du, baina elkartze-oinarritutako analisia apurtzen du.
Bilaketa-taulak gabeko hirugarrenekin partekatzeko: pseudonimizazioa nahikoa izan daiteke. Barne analisirako, anonimizazio osoa edo kontrol-sarbide zorrotza behar dira. Lege-betetze-gidak estaltzen du nola dokumentatu ikuspegia bakoitza zure ROParako.
Ondorioa
Hutsunea ez da tresna-porrot bat. Konfigurazio-hutsunea da. Tresnak ezin du zure kontu-zenbaki-formatua jakin esan gabe.
Entitate pertsonalizatuen konfigurazioa orduetan ixten du hutsunea. Betetze-taldeek formatuak definitzen dituzte, lagin-datuekin probatzen dituzte eta erabilera-modu guztietan aplikatzen dituzte. Ez da ingeniaritza-laguntzarik behar.
180.000 kontu-zenbaki zehaztatu gabeak ez zeuden tresnak porrot egin zuelako. Bertan zeuden tresna inoiz ez zelako esan haiek bilatzeko.