Les fulles de càlcul Excel són l'entorn de processament de dades més perillós per a la conformitat de GDPR. Milions de treballs de conformitat depenen de Excel o Google Sheets: analistes de dades que mantenen registres d'usuaris, equips d'assumptes legals que treballen amb base de dades de demandants, equips de RH que mantenen històrics de salaris. Els fulls contenen:
- Noms de persones (100% de fulls)
- Direccions de correu electrònic (80%)
- Números de telèfon (60%)
- Números de seguretat social / NIFs (40%)
- Salaris i informació de compensació (30%)
- Números de tarjeta de crèdit / números de compte bancari (20%)
- Dades mèdiques o de registres judicials (10%)
Per què Excel és singularment perillós per a GDPR
No hi ha delimitador estàndard: A diferència d'una base de dades, un Excel no té esquema. La columna A pot contenir «Nom Complet», o «Nom | País | Email» amb pipes com a delimitadores. L'analysador de PII ha d'intentar "adivinadora" quina columna és què.
Cel·les de fórmula ocultes: Els nombres que es mostren a la pantalla es creen per fórmules. =CONCATENATE(A1," ",B1) retorna «Jane Smith» però l'IA veu dues cel·les. =IF(C1>30000, "Alt", "Baix") retorna una categoria però l'IA veu els números complets.
Cel·les merged fusionades: Un capçal que diu "Dades de contacte" pot fusionar 3 columnes. Els anàlisis de cel·les singles no veure la fusió.