anonym.legal
Înapoi la BlogGDPR & Conformitate

Excel și GDPR: Cum să Anonimizați Fișierele Calcul...

Excel este printre cele mai dense tipuri de documente cu PII din operațiunile de afaceri.

April 21, 20268 min citire
Excel GDPRspreadsheet anonymizationXLSX complianceHR datadata minimization

De Ce Excel Este Cel Mai Riscant Tip de Document

Dintre toate tipurile de documente care acumulează PII în mediile de afaceri, foile de calcul sunt printre cele mai periculoase din perspectiva conformității GDPR.

Nu pentru că sunt cele mai sensibile — dosarele medicale și documentele juridice sunt în mod clar mai riscante pentru persoanele individuale. Ci pentru că foile de calcul Excel au caracteristici care le fac sistematic subtratate de procesele de conformitate:

Volum și răspândire: Un singur fișier XLSX poate conține 50.000 de rânduri și 100 de coloane. Fiecare celulă este o potențială locație PII. Niciun proces de revizuire manuală nu se scalează la acest volum în mod fiabil.

Diversitate structurală: Spre deosebire de documentele text (secvențiale) sau PDF-uri (bazate pe pagini), Excel are o structură bidimensională cu context distribuit orizontal (anteturi de coloană) și vertical (relații de rând). PII poate apărea oriunde.

Date critice de afaceri non-PII amestecate cu PII: Cifrele salariale, scorurile de performanță, codurile de departament și alte date legitime de afaceri există în același tabel cu CNP-urile și adresele de email. Anonimizarea nediscriminatorie care estompează datele non-PII face tabloul inutil.

Provocările Tehnice ale Detecției PII în Foi de Calcul

Abordările standard de analiză text eșuează pe foi de calcul în moduri previzibile:

Problema CNP-ca-Număr

Codurile numerice personale stocate în celule Excel fără separatori sunt stocate ca numere de Excel, nu ca text. Analiza textului care caută tipare specifice va rata acestea. Detecția conștientă de format trebuie să recunoască că un număr de 13 cifre într-o coloană etichetată „CNP" este un Cod Numeric Personal, chiar și fără formatare.

Problema Datelor-ca-Număr

Excel stochează datele intern ca numere de serie (1 ianuarie 1900 = 1). O celulă afișând „02/06/2024" este stocată ca „45329". Analiza unui CSV exportat din Excel poate vedea „45329" într-o coloană „Data Nașterii" — un număr, nu o dată. Detecția conștientă de context trebuie să gestioneze această conversie.

Problema Datelor Compute

Unele celule conțin formule care produc valori PII din alte celule. O celulă cu =CONCATENATE(B2," ",C2) ar putea produce un nume complet din coloanele de prenume și nume. Anonimizarea coloanelor de prenume și nume (B și C) este corectă; celula de concatenare trebuie de asemenea actualizată.

Surse: Ghidul de Conformitate GDPR pentru Instrumente Office Microsoft 2024; Raportul Anual de Aplicare CNIL 2024; Standardul Tehnic ISO/IEC 27559:2022

Pregătit să vă protejați datele?

Începeți să anonimizati PII cu 285+ tipuri de entități în 48 de limbi.