Volver al BlogTecnología Legal

GDPR y sus archivos de Excel: por qué la...

Las fórmulas de Excel hacen referencia a celdas que contienen nombres de clientes. Las tablas dinámicas almacenan datos sensibles.

April 10, 20268 min de lectura
Excel anonymizationspreadsheet GDPRpivot table redactioncell-level PII detectionformula preservation

Por qué las hojas de cálculo no son documentos

Un documento de Word es un flujo de texto secuencial con metadatos de formato. Una hoja de cálculo de Excel es una estructura de datos relacional: las celdas hacen referencia a otras celdas, las fórmulas operan en rangos de celdas, las tablas dinámicas agregan rangos de datos nombrados y las macros recorren el modelo de objeto de la hoja de cálculo. Tratar un archivo de Excel como un documento de texto que debe ser procesado para patrones de PII — que es cómo la mayoría de las herramientas de redacción de documentos abordan las hojas de cálculo — pierde las relaciones de datos que definen el contenido real de la hoja de cálculo.

Considere una hoja de cálculo de análisis de clientes. La columna A contiene nombres de clientes. La columna D contiene una fórmula: =VLOOKUP(A2, CustomerTable, 5, FALSE) — una búsqueda que devuelve el saldo de la cuenta del cliente según su nombre. Si la herramienta de anonimización reemplaza el nombre en la columna A pero no actualiza la referencia de la fórmula o la tabla de búsqueda, la fórmula sigue devolviendo el saldo de cuenta real para el nombre original. El documento "anonimizado" todavía expone la identidad original del cliente a través de la relación de datos.

Este no es un caso hipotético. Los archivos de Excel empresariales están construidos en torno a relaciones de datos. Reemplazar valores individuales de celdas de forma anónima sin comprender la estructura relacional produce documentos que parecen anonimizados pero retienen los datos originales a través de referencias de fórmulas, cachés de tablas dinámicas y búsquedas entre hojas.

El requisito de compartir datos de terceros del GDPR

El Artículo 28 del GDPR rige el intercambio de datos con procesadores: las organizaciones que comparten datos personales con partes externas (consultores, proveedores de análisis, auditores) deben garantizar salvaguardias técnicas adecuadas. La pregunta práctica: ¿cuál es una salvaguardia adecuada al compartir un conjunto de datos de Excel que contiene 50,000 registros de clientes con un proveedor de análisis externo?

La exportación a PDF elimina fórmulas y produce una instantánea — pero las exportaciones a PDF de archivos de Excel grandes frecuentemente corrompen el formato complejo y no son adecuadas para uso analítico. Convertir a CSV elimina fórmulas, tablas dinámicas y la mayor parte de la estructura analítica. Ninguna de las opciones proporciona al proveedor externo un conjunto de datos utilizable para su propósito analítico.

La anonimización a nivel de celda dentro del formato nativo de Excel — reemplazando valores identificativos mientras se preserva la estructura analítica — es el único enfoque que satisface simultáneamente tanto el requisito de salvaguardia del GDPR como el requisito de utilidad comercial.

Procesamiento aislado para hojas de cálculo de defensa

El 67% de las RFP de adquisiciones gubernamentales y de defensa citan requisitos de entorno aislado (DISA 2024). Los contratistas de defensa que trabajan con datos de personal, información logística o registros de adquisiciones en formato Excel no pueden utilizar herramientas de anonimización basadas en la nube por las mismas razones que prohíben el procesamiento de documentos basado en la nube: los datos no pueden salir de la red controlada.

La combinación de la capacidad de anonimización específica de Excel y el procesamiento solo local crea el perfil técnico requerido para el cumplimiento de contratos gubernamentales. La aplicación de escritorio procesa archivos de Excel localmente sin llamadas de red durante el procesamiento; los resultados de la anonimización nunca salen del entorno aislado; los archivos procesados están disponibles para compartir internamente dentro de la red controlada.

Inteligencia a nivel de celda

La anonimización efectiva de Excel opera en tres niveles simultáneamente:

Nivel de valor: Detectar y reemplazar valores de PII en celdas individuales. Nombres de clientes, direcciones de correo electrónico, números de teléfono y números de identificación nacional se identifican a través del mismo motor de detección híbrido utilizado para el procesamiento de documentos.

Nivel de fórmula: Identificar celdas cuyas fórmulas hacen referencia a celdas que contienen PII, y actualizar esas referencias para apuntar a los valores anonimizados o reemplazar la fórmula con su resultado calculado para prevenir la exposición de PII basada en fórmulas.

Nivel de estructura: Limpiar cachés de datos de tablas dinámicas, procesar filas y columnas ocultas, y manejar el código de macro VBA que hace referencia a direcciones o valores de celdas específicos.

Fuentes:

¿Listo para proteger sus datos?

Comience a anonimizar PII con más de 285 tipos de entidades en 48 idiomas.