Planilhas não são documentos
Um arquivo Word é um fluxo de texto. Um arquivo Excel é outra coisa. Células referenciam outras células. Fórmulas operam em intervalos. Tabelas dinâmicas agrupam dados nomeados. Macros percorrem toda a pasta de trabalho. A maioria das ferramentas de redação trata o Excel como um documento de texto. Esse é o modelo errado.
Um exemplo simples: a coluna A tem nomes de clientes. A coluna D tem esta fórmula: =VLOOKUP(A2, CustomerTable, 5, FALSE). A fórmula busca o saldo da conta pelo nome. Você substitui o nome na coluna A. Não atualiza a fórmula nem a tabela de referência. A fórmula ainda retorna o saldo real para o nome original. O arquivo parece limpo. Não está.
Isso é comum em arquivos Excel corporativos. Os dados vivem em relacionamentos, não apenas em células. Substituir valores de células sem rastrear esses relacionamentos deixa dados pessoais expostos.
RGPD Artigo 28 e compartilhamento externo
O artigo 28 do RGPD rege o compartilhamento de dados com operadores. Se você envia dados pessoais a um consultor, fornecedor ou auditor, precisa de salvaguardas técnicas.
Suponha que você precise compartilhar um arquivo de 50.000 linhas de clientes com um fornecedor de análise. Um export em PDF elimina as fórmulas. Também danifica arquivos grandes com formatação complexa. Um CSV também elimina fórmulas e tabelas dinâmicas. Nenhuma opção dá ao fornecedor um conjunto de dados utilizável.
A única opção que funciona: anonimizar dentro do formato Excel nativo. Substitua os valores identificadores. Mantenha a estrutura. O fornecedor recebe um arquivo funcional. Você atende ao requisito de salvaguarda do RGPD.
Ambientes isolados da rede
67% dos editais de licitação do governo e defesa citam requisitos de ambiente isolado (DISA 2024). Contratantes de defesa gerenciam dados de pessoal, registros logísticos e arquivos de compras em Excel. Não podem usar ferramentas na nuvem. Os dados não podem sair da rede controlada.
O aplicativo desktop resolve isso. Ele processa arquivos Excel na máquina local. Não há chamadas de rede durante o processamento. O arquivo de saída nunca sai do ambiente isolado. Equipes internas podem compartilhar arquivos limpos dentro da rede controlada.
Isso atende ao perfil técnico exigido para conformidade com contratos governamentais.
Três níveis de inteligência de célula
Uma boa anonimização de Excel funciona em três níveis ao mesmo tempo.
Nível de valor: Encontrar e substituir dados pessoais em células individuais. Nomes, e-mails, telefones e identificadores nacionais são detectados com o mesmo mecanismo usado para o processamento de documentos.
Nível de fórmula: Encontrar células cujas fórmulas referenciam células com dados pessoais. Atualizar essas referências para os valores anonimizados. Ou substituir a fórmula pelo seu resultado para evitar exposição por fórmula.
Nível de estrutura: Limpar os caches de dados das tabelas dinâmicas. Processar linhas e colunas ocultas. Tratar código de macro VBA que usa endereços ou valores de células específicos.
Os três níveis devem funcionar juntos. Corrigir valores sem corrigir fórmulas deixa dados pessoais expostos. Corrigir fórmulas sem limpar caches produz o mesmo resultado.
Esse desafio existe em todos os formatos de arquivo. Veja como a fragmentação de formatos afeta a detecção de dados pessoais para uma visão mais ampla.
Para equipes que trabalham com dados estruturados no nível de API: minimização de dados RGPD em APIs em tempo real.
Para grandes exportações de pedidos de acesso: processamento em lote RGPD em escala.