Els fulls de calcul no son documents
Un fitxer Word es un flux de text. Un fitxer Excel es una altra cosa. Les cel·les apunten a altres cel·les. Les formules s'executen sobre rangs. Les taules dinamiques agrupen dades amb nom. Les macros recorren tot el llibre de treball. La majoria d'eines de redaccio tracten Excel com un document de text. Aixo es el model equivocat.
Aqui teniu un exemple simple. La columna A conte noms de clients. La columna D te aquesta formula: =VLOOKUP(A2, CustomerTable, 5, FALSE). Aquesta formula cerca el saldo del compte pel nom. Substituiu el nom a la columna A. No actualitzeu la formula ni la taula de cerca. La formula encara retorna el saldo real del nom original. El fitxer sembla net. No ho esta.
Aixo es comu als fitxers Excel empresarials. Les dades viuen en relacions — no nomes en cel·les. Substituir els valors de les cel·les sense rastrejar aquestes relacions deixa les dades personals (PII) exposades.
L'article 28 del GDPR i el compartiment extern
L'article 28 del GDPR cobreix el compartiment de dades amb processadors. Si envieu dades personals a un consultor, proveidor o auditor, necessiteu mesures tecniques de proteccio.
Suposem que heu de compartir un fitxer de 50.000 files de clients amb un proveidor d'analisi. Una exportacio en PDF elimina les formules. Tambe trenca els fitxers grans amb format complex. Un CSV elimina les formules i les taules dinamiques tambe. Cap de les dues opcions dona al proveidor un conjunt de dades utilisable.
L'unica opcio que funciona: anonimitzar dins del format natiu d'Excel. Substituir els valors identificadors. Conservar l'estructura. El proveidor rep un fitxer funcional. Compliu el requisit de proteccio del GDPR.
Entorns air-gapped
El 67% dels plecs de licitacio de contractacio governamental i de defensa citen requisits d'entorns air-gapped (DISA 2024). Els contractistes de defensa gestionen dades de personal, registres logistics i fitxers de contractacio en Excel. No poden utilitzar eines al núvol. Les dades no poden sortir de la xarxa controlada.
L'aplicacio d'escriptori soluciona aixo. Processa fitxers Excel a la maquina local. No es produeixen trucades de xarxa durant el processament. El fitxer de sortida mai no surt de l'entorn air-gapped. Els equips interns poden compartir fitxers nets dins de la xarxa controlada.
Aixo compleix el perfil tecnic requerit per al compliment dels contractes governamentals.
Tres nivells d'intelligència de cel·les
Una bona anonimitzacio d'Excel treballa en tres nivells alhora.
Nivell de valor: Cerca i substitueix les PII en cel·les individuals. Noms, correus electrònics, numeros de telefon i documents nacionals es marquen amb el mateix motor de deteccio que el processament de documents.
Nivell de formula: Cerca les cel·les les formules de les quals fan referència a cel·les amb PII. Actualitza aquestes referències per apuntar als valors anonimitzats. O substitueix la formula pel seu resultat per aturar l'exposicio de PII basada en formules.
Nivell d'estructura: Esborra les caches de dades de les taules dinamiques. Processa les files i columnes ocultes. Gestiona el codi de macros VBA que utilitza adreces o valors de cel·les especifics.
Els tres nivells han de funcionar conjuntament. Corregir els valors sense corregir les formules deixa les PII al seu lloc. Corregir les formules sense netejar les caches fa el mateix.
Aquest repte abasta tots els formats de fitxer. Consulteu com la fragmentacio de formats afecta la deteccio de PII per a una visio mes amplia.
Per als equips que treballen amb dades estructurades a nivell d'API, consulteu la minimitzacio de dades GDPR en APIs en temps real.
Si el vostre equip realitza exportacions DSAR a gran escala, consulteu el processament per lots DSAR del GDPR a escala per als patrons de flux de treball que s'apliquen aqui.