De ce foile de calcul nu sunt documente
Un document Word este un flux de text secvențial cu metadate de formatare. O foaie de calcul Excel este o structură de date relațională: celulele fac referință la alte celule, formulele operează pe intervale de celule, tabelele pivot agregă intervale de date denumite, iar macrourile traversează modelul obiect al foii de calcul. Tratarea unui fișier Excel ca pe un document text care trebuie procesat pentru modele PII — ceea ce fac majoritatea instrumentelor de redactare a documentelor cu foile de calcul — ratează relațiile de date care definesc conținutul real al foii de calcul.
Considerați o foaie de calcul de analiză a clienților. Coloana A conține nume de clienți. Coloana D conține o formulă: =VLOOKUP(A2, CustomerTable, 5, FALSE) — o căutare care returnează soldul contului clientului pe baza numelui acestuia. Dacă instrumentul de anonimizare înlocuiește numele din coloana A, dar nu actualizează referința formulei sau tabelul de căutare, formula continuă să returneze soldul contului real pentru numele original. Documentul "anonimizat" expune în continuare identitatea clientului original prin relația de date.
Acesta nu este un caz marginal ipotetic. Fișierele Excel din întreprinderi sunt construite în jurul relațiilor de date. Înlocuirea anonimă a valorilor celulelor individuale fără a înțelege structura relațională produce documente care par anonimizate, dar reținând datele originale prin referințe de formule, cache-uri de tabele pivot și căutări între foi.
Cerința GDPR pentru partajarea cu terți
Articolul 28 GDPR reglementează partajarea datelor cu procesatorii: organizațiile care partajează date cu caracter personal cu părți externe (consultanți, furnizori de analiză, auditori) trebuie să asigure garanții tehnice corespunzătoare. Întrebarea practică: ce este o garanție corespunzătoare atunci când se partajează un set de date Excel care conține 50.000 de înregistrări de clienți cu un furnizor extern de analiză?
Exportul PDF elimină formulele și produce o captură de ecran — dar exporturile PDF ale fișierelor Excel mari frecvent corup formatarea complexă și nu sunt potrivite pentru utilizare analitică. Conversia la CSV elimină formulele, tabelele pivot și cea mai mare parte a structurii analitice. Niciuna dintre opțiuni nu oferă furnizorului extern un set de date utilizabil pentru scopul lor analitic.
Anonimizarea la nivel de celulă în formatul Excel nativ — înlocuirea valorilor de identificare, păstrând în același timp structura analitică — este singura abordare care satisface simultan atât cerința de garanție GDPR, cât și cerința de utilitate comercială.
Procesare în medii izolate de rețea pentru foi de calcul de apărare
67% din RFP-urile de achiziții guvernamentale și de apărare citează cerințe de mediu izolat de rețea (DISA 2024). Contractorii de apărare care lucrează cu date de personal, informații de logistică sau înregistrări de achiziții în format Excel nu pot utiliza instrumente de anonimizare bazate pe cloud din aceleași motive care interzic procesarea documentelor bazate pe cloud: datele nu pot părăsi rețeaua controlată.
Combinația dintre capacitatea de anonimizare specifică Excel și procesarea doar locală creează profilul tehnic necesar pentru conformitatea contractelor guvernamentale. Aplicația Desktop procesează fișierele Excel local fără apeluri de rețea în timpul procesării; rezultatele anonimizării nu părăsesc niciodată mediul izolat de rețea; fișierele procesate sunt disponibile pentru partajare internă în cadrul rețelei controlate.
Inteligență la nivel de celulă
Anonimizarea eficientă a Excel operează pe trei niveluri simultan:
Nivel de valoare: Detectarea și înlocuirea valorilor PII în celule individuale. Nume de clienți, adrese de e-mail, numere de telefon și numere de identificare naționale sunt identificate prin același motor de detectare hibrid utilizat pentru procesarea documentelor.
Nivel de formulă: Identificarea celulelor ale căror formule fac referință la celule care conțin PII și actualizarea acestor referințe pentru a indica valorile anonimizate sau înlocuirea formulei cu rezultatul calculat pentru a preveni expunerea PII bazată pe formule.
Nivel de structură: Ștergerea cache-urilor de date ale tabelelor pivot, procesarea rândurilor și coloanelor ascunse și gestionarea codului macro VBA care face referință la adrese sau valori specifice de celule.
Surse: