Mes enlla dels SSN: Anonimitzar els IDs interns de la vostra organitzacio
La vostra eina GDPR elimina les adreces de correu electronic. Elimina els numeros de telefon. Elimina els noms. Executeu les exportacions de suport a traves d'ella. Despres compartiu la sortida amb el vostre equip d'analítica.
Els vostres numeros de compte de client segueixen en cada ticket. Els vostres IDs de comanda segueixen alli. Els vostres IDs d'usuari interns tambe segueixen alli.
Aquests IDs semblen innocus per si sols. Sense una taula de cerca, no identifiquen una persona. Pero el vostre equip d'analítica te aquella taula. El vostre CRM la te. La vostra base de dades de suport la te. Qualsevol persona amb acces pot trobar la persona en segons.
Aixo es un error de GDPR. L'eina no va fallar. Mai no se li va dir que busques els vostres IDs.
Que detecten les eines PIE estandard
Les eines PIE estandard cobreixen els formats universals. Detecten el que utilitza tota organitzacio.
Les eines estandard detecten:
- Numeros de la seguretat social (SSN dels EUA, NINO del Regne Unit, formats d'ID nacionals de la UE)
- Adreces de correu electronic
- Numeros de telefon
- Numeros de targeta de credit
- Noms
- Numeros de passaport i de permis de conduir
Les eines estandard no detecten:
- IDs d'empleats en el vostre format EMP-XXXXX
- Numeros de compte de clients en el vostre format ACC-XXXXXXXX-XX
- IDs de comanda en el vostre format ORD-XXXXXXX
- IDs d'usuari interns en format UUID o personalitzat
- Codis de referencia específics de socis
Les eines estandard troben patrons universals. Els vostres IDs interns no son universals. Necessiten configuracio personalitzada per ser detectats.
El risc de reidentificacio
Una empresa exporta tickets de suport per a revisio de qualitat. L'eliminacio PIE estandard elimina noms, correus electronics i numeros de telefon. Els numeros de compte en format ACC-XXXXXXXX-XX no es toquen.
L'exportacio va a l'equip d'analítica. Un analista uneix la taula de tickets amb la base de dades de clients pel numero de compte. La persona es troba de seguida. No cal cap truc especial. Es una unio SQL rutinaria.
L'article 4(5) del GDPR defineix la pseudonimitzacio com el processament on les dades "ja no es poden atribuir a un subjecte de dades concret sense l'us d'informacio addicional". Els numeros de compte fallen aquesta prova. La informacio addicional - la vostra base de dades de clients - es troba allí mateix a la vostra organitzacio.
L'exportacio "anonimitzada" no era anonima.
Crear patrons d'entitats personalitzades
La configuracio d'entitats personalitzades es rapida. Els equips de compliment ho poden fer sense ajuda d'enginyeria.
Pas 1: Llisteu els vostres formats d'ID.
Escriviu-ne cada un. Per exemple: compte ACC-XXXXXXXX-XX, ID de comanda ORD-XXXXXXX, ID d'empleat EMP-XXXXX.
Pas 2: Descriviu el format en llenguatge planer.
"Els numeros de compte comencen per ACC, despres un guio, despres 8 dígits, despres un guio, despres 2 lletres majuscules."
La generacio de patrons assistida per IA retorna: ACC-\d{8}-[A-Z]{2}
Pas 3: Proveu en dades d'exemple.
Carregueu entre 20 i 30 documents. Confirmeu que es troben totes les instancies. Confirmeu que no apareixen hits falsos.
Pas 4: Trieu un metode.
Per a IDs usats com a claus d'unio, on l'analisi necessita vincular registres:
- Pseudonimitzeu. Substituiu ACC-00123456-AB per ACC-99876543-XY cada vegada. La mateixa entrada sempre dona la mateixa sortida. Les unions segueixen funcionant. El valor original no es pot trobar sense la clau.
Per a IDs que no es necessiten en l'analisi:
- Redacteu. Substituiu per [REDACTED]. Simple. Permanent.
Pas 5: Deseu com a preset compartit.
Deseu l'entitat personalitzada - o un conjunt d'elles - en un preset compartit. La configuracio s'aplica a tots els usos: carregues per lots, crides API, interfície del navegador. Els nous membres de l'equip obtenen la configuracio completa de seguida.
Cas d'estudi: 180.000 tickets de suport
Una empresa va trobar 180.000 tickets de suport al seu magatzem analític. S'havien eliminat els noms i els correus electronics. Els numeros de compte no. Cada ticket seguia tenint un valor ACC-XXXXXXXX-XX actiu.
Cronologia de la resolucio:
- El responsable de compliment defineix el patro ACC - 15 minuts
- El prova en 30 tickets d'exemple - 20 minuts
- Confirma la precisio - 10 minuts
- Processa 180.000 tickets en un lot nocturn
- Substitueix les taules del magatzem per les versions netes
Temps total per al responsable de compliment: 45 minuts. Sense suport d'entitats personalitzades, la solucio hauria necessitat un ticket d'enginyeria, revisio de codi i un desplegament. Aixo triga setmanes, no hores.
Per a una analisi mes propera de com els IDs personalitzats creen risc en les eines d'IA de suport, consulteu la guia de GDPR i IA de suport.
On es propaguen els IDs personalitzats
Els IDs interns apareixen en mes llocs del que esperen la majoria d'equips.
Documents interns:
- Notes de reunions amb referencies a comptes o IDs de comanda
- Fils de correu electronic sobre casos de clients
- Presentacions amb dades d'estudis de cas
Compartits amb tercers:
- Informes a reguladors amb numeros de referencia de casos
- Fitxers d'auditoria amb referencies de clients
- Fitxers de proveïdors que porten IDs de clients
Recerca i analítica:
- Conjunts de dades de recorregut del client
- Exportacions de revisio de qualitat de suport
- Dades d'entrenament per a models ML interns
Cada context necessita la mateixa configuracio d'entitats personalitzades per produir una sortida veritablement anonima.
Pseudonimitzacio vs. Anonimitzacio
El GDPR estableix una linia clara.
La pseudonimitzacio substitueix els IDs per substituts. La persona original es pot trobar de nou si algu te la taula de cerca. Aquestes dades segueixen sent dades personals. Redueix el risc. No elimina les vostres obligacions GDPR.
L'anonimitzacio elimina la capacitat de reidentificar. Les dades anonimes no son dades personals. El GDPR no s'hi aplica.
Els numeros de compte i els IDs de comanda son pseudonims quan existeixen taules de cerca. Substituir-los per substituts fixos redueix el risc, pero el GDPR segueix aplicant-se. Substituir-los per tokens aleatoris - i eliminar la clau - elimina l'obligacio GDPR, pero trenca l'analisi basada en unions.
Per compartir amb tercers que no tenen les vostres taules de cerca: la pseudonimitzacio pot ser suficient. Per a l'analítica interna, cal anonimitzacio completa o controls d'acces estrictes. La guia de compliment legal cobreix com documentar cada enfocament per al vostre ROPA.
Conclusio
La llacuna no es una fallada de l'eina. Es una llacuna de configuracio. Cap eina pot coneixer el vostre format de numero de compte a menys que li ho digueu.
La configuracio d'entitats personalitzades tanca la llacuna en hores. Els equips de compliment defineixen els formats, els proven en dades d'exemple i els apliquen a tots els modes d'us. No cal ajuda d'enginyeria.
Els 180.000 numeros de compte no redactats no eren alli perque l'eina hagues fallat. Eren alli perque mai no se li va dir que els busques.