Decalajul de conformitate în foi de calcul
Instrumentele de redactare PDF nu gestionează foile de calcul Excel. Acest singur fapt creează un decalaj sistematic de conformitate pentru organizațiile care stochează date personale în format Excel — ceea ce, în mediile enterprise, înseamnă practic fiecare departament HR, echipă de finanțe și departament operațional.
Datele din Raportul Anual al EDPB arată că cererile de Drept de Acces GDPR au crescut cu 180% din 2021 până în 2024. Organizațiile care primesc DSAR-uri trebuie să furnizeze solicitantului datele sale personale într-un format portabil, asigurând în același timp că datele terților incluse în același set de date sunt protejate în mod corespunzător. Pentru un set de date de angajați stocat în Excel, răspunsul standard — exportul rândurilor specifice — expune în continuare datele altor angajați în același fișier. Conformitatea corectă cu DSAR necesită anonimizare per înregistrare a datelor non-solicitant.
Procesarea medie a unei DSAR durează 12 ore manual. Pentru o organizație care primește 200 DSAR-uri pe lună — un volum modest pentru o companie de dimensiuni medii — aceasta reprezintă 2.400 de ore de personal lunar în cheltuieli de conformitate. Abordarea manuală nu se scalează la volumul de cereri pe care datele EDPB le proiectează pentru restul acestei decade.
Ce necesită cu adevărat anonimizarea Excel
Anonimizarea foilor de calcul prezintă provocări pe care instrumentele de redactare PDF nu sunt concepute să le gestioneze.
Rânduri și coloane ascunse: Fișierele Excel conțin în mod obișnuit rânduri ascunse (date în proiect, înregistrări filtrate) și coloane ascunse (calcule intermediare, valori originale înainte de transformare). Un instrument de redactare care procesează doar celulele vizibile lasă PII-ul ascuns intact. Un anonimizator Excel de nivel conformitate trebuie să proceseze toate foile, inclusiv pe cele ascunse.
Formule încorporate: Celulele care conțin formule care fac referință la PII în alte celule pot afișa valori derivate, în timp ce formula în sine face referință la datele originale. Anonimizarea valorii afișate fără actualizarea referinței formulei lasă PII-ul original accesibil oricui inspectează formula.
Cache-ul tabelului pivot: Tabelele pivot Excel cache-ază datele subiacente utilizate pentru a genera pivotul. Anonimizarea foii de date sursă nu șterge automat cache-ul pivot. Un utilizator adversarial care primește un fișier Excel "anonimizat" poate inspecta cache-ul pivot pentru a recupera datele originale.
Referințe între foi: Fișierele Excel enterprise conțin în mod obișnuit referințe de celule între foi. Numele unui angajat poate apărea pe Foaia 1 și poate fi referențiat în calcule pe Foaia 3. Anonimizarea Foii 1 fără actualizarea referințelor Foii 3 lasă o referință la datele anonimizate care poate dezvălui valoarea originală prin inspectarea formulei.
Cazul de utilizare al departamentului HR
O companie germană de producție trebuie să partajeze 50.000 de înregistrări de angajați cu un consultant extern de compensații pentru un proiect de benchmarking. Articolul 28 GDPR necesită ca partajarea datelor personale cu un procesor (consultantul extern) să implice controale tehnice corespunzătoare. Fișierul Excel conține 37 de coloane, inclusiv nume, adrese de email personale, adrese de domiciliu, salarii, evaluări de performanță și înregistrări de concediu medical.
Anonimizarea manuală a 50.000 de rânduri pe 37 de coloane nu este fezabilă în niciun interval de timp de conformitate. Procesele Word și Excel Add-in procesează foaia de calcul nativ — în Microsoft Excel, fără export sau conversie. Detectarea PII la nivel de celulă identifică datele personale pe toate foile vizibile și ascunse. Numele sunt înlocuite cu pseudonime; adresele cu substituenți de tip corespunzător; salariile reținute (nu sunt PII) în timp ce identificatorii personali asociați sunt eliminați. Anonimizarea procesează 50.000 de rânduri în minute mai degrabă decât în zile.
Configuratia per-entitate permite tratament diferit pentru diferite tipuri de date: nume înlocuite cu pseudonime consistente (același nume în celule diferite primește același pseudonim, păstrând utilitatea analitică); SSN-uri înlocuite cu șiruri mascate; adrese înlocuite cu aproximări doar pentru oraș; adrese de email personale înlocuite cu substituenți bazați pe rol.
Surse: