Torna al BlogTecnologia Legale

GDPR e i tuoi file Excel: perché l'anonimizzazione...

Le formule di Excel fanno riferimento a celle contenenti nomi di clienti. Le tabelle pivot memorizzano dati sensibili.

April 10, 20268 min di lettura
Excel anonymizationspreadsheet GDPRpivot table redactioncell-level PII detectionformula preservation

Perché i fogli di calcolo non sono documenti

Un documento Word è un flusso di testo sequenziale con metadati di formattazione. Un foglio di calcolo Excel è una struttura di dati relazionale: le celle fanno riferimento ad altre celle, le formule operano su intervalli di celle, le tabelle pivot aggregano intervalli di dati nominati e le macro attraversano il modello a oggetti del foglio di calcolo. Trattare un file Excel come un documento di testo da elaborare per i modelli PII — che è come la maggior parte degli strumenti di redazione dei documenti si avvicina ai fogli di calcolo — perde le relazioni dei dati che definiscono il contenuto effettivo del foglio di calcolo.

Considera un foglio di calcolo per l'analisi dei clienti. La colonna A contiene i nomi dei clienti. La colonna D contiene una formula: =VLOOKUP(A2, CustomerTable, 5, FALSE) — una ricerca che restituisce il saldo del conto del cliente in base al suo nome. Se lo strumento di anonimizzazione sostituisce il nome nella colonna A ma non aggiorna il riferimento della formula o la tabella di ricerca, la formula continua a restituire il saldo del conto reale per il nome originale. Il documento "anonimizzato" espone ancora l'identità originale del cliente attraverso la relazione dei dati.

Questo non è un caso limite ipotetico. I file Excel aziendali sono costruiti attorno alle relazioni dei dati. Sostituire valori di celle individuali senza comprendere la struttura relazionale produce documenti che sembrano anonimizzati ma mantengono i dati originali attraverso i riferimenti delle formule, le cache delle tabelle pivot e le ricerche tra fogli.

Il requisito di condivisione con terze parti del GDPR

L'Articolo 28 del GDPR regola la condivisione dei dati con i responsabili del trattamento: le organizzazioni che condividono dati personali con parti esterne (consulenti, fornitori di analisi, revisori) devono garantire adeguate misure tecniche di protezione. La domanda pratica: quale è una misura di protezione adeguata quando si condivide un dataset Excel contenente 50.000 registrazioni di clienti con un fornitore di analisi esterno?

L'esportazione in PDF rimuove le formule e produce uno snapshot — ma le esportazioni PDF di grandi file Excel corrompono frequentemente la formattazione complessa e non sono adatte per l'uso analitico. La conversione in CSV rimuove formule, tabelle pivot e gran parte della struttura analitica. Nessuna delle due opzioni fornisce al fornitore esterno un dataset utilizzabile per il loro scopo analitico.

L'anonimizzazione a livello di cella all'interno del formato Excel nativo — sostituendo i valori identificativi mantenendo la struttura analitica — è l'unico approccio che soddisfa sia il requisito di protezione del GDPR sia il requisito di utilità aziendale simultaneamente.

Elaborazione isolata per i fogli di calcolo della difesa

Il 67% delle RFP di approvvigionamento governativo e della difesa cita requisiti di ambiente isolato (DISA 2024). I contraenti della difesa che lavorano con dati del personale, informazioni logistiche o registrazioni di approvvigionamento in formato Excel non possono utilizzare strumenti di anonimizzazione basati su cloud per le stesse ragioni che vietano l'elaborazione di documenti basata su cloud: i dati non possono lasciare la rete controllata.

La combinazione di capacità di anonimizzazione specifica per Excel e elaborazione solo locale crea il profilo tecnico richiesto per la conformità ai contratti governativi. L'app Desktop elabora i file Excel localmente senza chiamate di rete durante l'elaborazione; i risultati dell'anonimizzazione non lasciano mai l'ambiente isolato; i file elaborati sono disponibili per la condivisione interna all'interno della rete controllata.

Intelligenza a livello di cella

Un'anonimizzazione efficace di Excel opera su tre livelli simultaneamente:

Livello valore: Rilevamento e sostituzione dei valori PII nelle singole celle. I nomi dei clienti, gli indirizzi email, i numeri di telefono e i numeri di identificazione nazionale vengono identificati attraverso lo stesso motore di rilevamento ibrido utilizzato per l'elaborazione dei documenti.

Livello formula: Identificazione delle celle le cui formule fanno riferimento a celle contenenti PII e aggiornamento di quei riferimenti per puntare ai valori anonimizzati o sostituzione della formula con il suo risultato calcolato per prevenire l'esposizione PII basata su formula.

Livello struttura: Pulizia delle cache dei dati delle tabelle pivot, elaborazione di righe e colonne nascoste e gestione del codice VBA delle macro che fanno riferimento a indirizzi o valori di celle specifiche.

Fonti:

Pronto a proteggere i tuoi dati?

Inizia ad anonimizzare i PII con oltre 285 tipi di entità in 48 lingue.