Les tableurs ne sont pas des documents
Un fichier Word est un flux de texte. Un fichier Excel est autre chose. Les cellules font référence à d'autres cellules. Les formules opèrent sur des plages. Les tableaux croisés dynamiques regroupent des données nommées. Les macros parcourent l'ensemble du classeur. La plupart des outils de caviardage traitent Excel comme un document texte. C'est le mauvais modèle.
Voici un exemple simple. La colonne A contient des noms de clients. La colonne D contient cette formule : =VLOOKUP(A2, CustomerTable, 5, FALSE). Cette formule recherche le solde du compte par nom. Vous remplacez le nom dans la colonne A. Vous ne mettez pas à jour la formule ni la table de recherche. La formule renvoie toujours le vrai solde pour le nom d'origine. Le fichier semble propre. Il ne l'est pas.
C'est courant dans les fichiers Excel d'entreprise. Les données vivent dans des relations — pas seulement dans des cellules. Remplacer des valeurs de cellule sans tracer ces relations laisse les données personnelles exposées.
RGPD Article 28 et partage externe
L'article 28 du RGPD régit le partage de données avec les sous-traitants. Si vous envoyez des données personnelles à un consultant, un fournisseur ou un auditeur, vous avez besoin de garanties techniques.
Supposons que vous deviez partager un fichier client de 50 000 lignes avec un fournisseur d'analyses. Un export PDF supprime les formules. Il casse aussi les grands fichiers avec une mise en forme complexe. Un CSV supprime également les formules et les tableaux croisés. Aucune option ne donne au fournisseur un jeu de données utilisable.
La seule option qui fonctionne : anonymiser dans le format Excel natif. Remplacez les valeurs identifiantes. Conservez la structure. Le fournisseur obtient un fichier fonctionnel. Vous répondez à l'exigence de garantie du RGPD.
Environnements isolés
67 % des appels d'offres de marchés publics et de défense citent des exigences d'environnement isolé (DISA 2024). Les sous-traitants de défense gèrent des données de personnel, des dossiers logistiques et des fichiers de marchés dans Excel. Ils ne peuvent pas utiliser d'outils cloud. Les données ne peuvent pas quitter le réseau sécurisé.
L'application de bureau résout ce problème. Elle traite les fichiers Excel en local. Aucun appel réseau ne se produit pendant le traitement. Le fichier de sortie ne quitte jamais l'environnement isolé. Les équipes internes peuvent partager des fichiers propres au sein du réseau sécurisé.
Cela répond au profil technique requis pour la conformité aux contrats publics.
Trois niveaux d'intelligence cellulaire
Une bonne anonymisation Excel fonctionne sur trois niveaux à la fois.
Niveau valeur : Trouver et remplacer les données personnelles dans les cellules. Les noms, e-mails, numéros de téléphone et identifiants nationaux sont détectés avec le même moteur que pour le traitement de documents.
Niveau formule : Trouver les cellules dont les formules référencent des cellules contenant des données personnelles. Mettre à jour ces références vers les valeurs anonymisées. Ou remplacer la formule par son résultat pour bloquer l'exposition par formule.
Niveau structure : Vider les caches de données des tableaux croisés dynamiques. Traiter les lignes et colonnes masquées. Gérer le code macro VBA qui utilise des adresses ou valeurs de cellules spécifiques.
Les trois niveaux doivent fonctionner ensemble. Corriger les valeurs sans corriger les formules laisse des données personnelles exposées. Corriger les formules sans vider les caches produit le même résultat.
Ce défi concerne tous les formats de fichiers. Lisez comment la fragmentation des formats affecte la détection des données personnelles pour une vue d'ensemble.
Pour les équipes traitant des données structurées au niveau API : minimisation des données RGPD dans les API en temps réel.
Pour les grands exports de demandes d'accès : traitement par lots RGPD à grande échelle.