De Ce Excel Este Cel Mai Riscant Tip de Document
Dintre toate tipurile de documente care acumulează PII în mediile de afaceri, foile de calcul sunt printre cele mai periculoase din perspectiva conformității GDPR.
Nu pentru că sunt cele mai sensibile — dosarele medicale și documentele juridice sunt în mod clar mai riscante pentru persoanele individuale. Ci pentru că foile de calcul Excel au caracteristici care le fac sistematic subtratate de procesele de conformitate:
Volum și răspândire: Un singur fișier XLSX poate conține 50.000 de rânduri și 100 de coloane. Fiecare celulă este o potențială locație PII. Niciun proces de revizuire manuală nu se scalează la acest volum în mod fiabil.
Diversitate structurală: Spre deosebire de documentele text (secvențiale) sau PDF-uri (bazate pe pagini), Excel are o structură bidimensională cu context distribuit orizontal (anteturi de coloană) și vertical (relații de rând). PII poate apărea oriunde.
Date critice de afaceri non-PII amestecate cu PII: Cifrele salariale, scorurile de performanță, codurile de departament și alte date legitime de afaceri există în același tabel cu CNP-urile și adresele de email. Anonimizarea nediscriminatorie care estompează datele non-PII face tabloul inutil.
Provocările Tehnice ale Detecției PII în Foi de Calcul
Abordările standard de analiză text eșuează pe foi de calcul în moduri previzibile:
Problema CNP-ca-Număr
Codurile numerice personale stocate în celule Excel fără separatori sunt stocate ca numere de Excel, nu ca text. Analiza textului care caută tipare specifice va rata acestea. Detecția conștientă de format trebuie să recunoască că un număr de 13 cifre într-o coloană etichetată „CNP" este un Cod Numeric Personal, chiar și fără formatare.
Problema Datelor-ca-Număr
Excel stochează datele intern ca numere de serie (1 ianuarie 1900 = 1). O celulă afișând „02/06/2024" este stocată ca „45329". Analiza unui CSV exportat din Excel poate vedea „45329" într-o coloană „Data Nașterii" — un număr, nu o dată. Detecția conștientă de context trebuie să gestioneze această conversie.
Problema Datelor Compute
Unele celule conțin formule care produc valori PII din alte celule. O celulă cu =CONCATENATE(B2," ",C2) ar putea produce un nume complet din coloanele de prenume și nume. Anonimizarea coloanelor de prenume și nume (B și C) este corectă; celula de concatenare trebuie de asemenea actualizată.
Surse: Ghidul de Conformitate GDPR pentru Instrumente Office Microsoft 2024; Raportul Anual de Aplicare CNIL 2024; Standardul Tehnic ISO/IEC 27559:2022