Medzera GDPR v Exceli
Nastroje na redakciu PDF nefungujú na súboroch Excel. Toto vytvára medzeru v dodrziavanipredpisov. V podnikovom prostredí ovplyvňuje každý tím HR, financií a prevádzkový tím.
Žiadosti o prístup GDPR vzrástli o 180 % medzi rokmi 2021 a 2024 (Výročná správa EDPB). Ked príde DSAR, musíte zdieľať osobné data žiadateľa. Musíte tiez chraniť data všetkých ostatných v tom istom súbore. Export konkrétnych riadkov nestačí. Ostatné záznamy zostávajú viditeľné. Správny súlad DSAR znamená anonymizovanie všetkých dat, ktoré nepatria žiadateľovi.
Priemerný DSAR trvá 12 hodín ručného spracovania. Pri 200 DSAR za mesiac je to 2 400 pracovných hodín. Ručné spracovanie nie je škálovateľné.
Čo musí anonymizácia Excelu pokryť
Tabuľky majú problémy, na ktoré textové nastroje nie su navrhnuté.
Skryté riadky a stĺpce. Súbory Excel casto skrývajú riadky a stĺpce. Tieto môžu obsahovať záznamy konceptov alebo pôvodné hodnoty. Nastroj, ktorý číta iba viditeľné bunky, PII v skrytých oblastiach prehliadne.
Referencie vzorcov. Bunka môže zobrazovať hodnotu zostavenou z inych buniek. Vymazanie zdrojových buniek neaktualizuje výstup vzorca. Pôvodná PII zostáva vo výsledku vzorca.
Vyrovnávacia pamäť kontingenčnej tabuľky. Kontingenčné tabuľky v Exceli ukladajú kópiu zdrojových dat. Vymazanie zdrojového hárka nevymaže vyrovnávaciu pamäť. Ktokoľvek so súborom môže čítať uložené data.
Medzihárková prepojenia. Meno na Hárkeu 1 sa môže objaviť vo vzorci na Hárku 3. Vymazanie Hárku 1 bez aktualizácie Hárku 3 môže odhaliť pôvodnú hodnotu cez vzorec.
Nástroj na úrovni dodržiavania predpisov musí spracovávať všetky hárky — vrátane skrytých — a aktualizovať všetky referencie vzorcov.
Prípad HR: Zdieľanie 50 000 záznamov zamestnancov
Nemecký výrobca musí zdieľať 50 000 záznamov zamestnancov s externým poradcom. GDPR Článok 28 vyzaduje technické kontroly pri zdieľaní dat so sprostredkovateľom. Súbor má 37 stĺpcov: mena, domáce adresy, platy, hodnotenia a data o zdravotnej dovolenke.
Ručná anonymizácia 50 000 riadkov nie je realizovateľná v žiadnom okne dodržiavania predpisov.
Doplnok Word a Excel funguje priamo v Microsoft Excel — žiadny export nie je potrebný. Detekcia PII prebieha na všetkých viditeľnych aj skrytých hárkoch. Mená sa stanú konzistentnými pseudonymami. To isté meno v dvoch bunkách dostane rovnaký token. Analytické prepojenia zostanú nedotknuté. Adresy sa stanu vhodne typovými záplnami. Platy zostanú nezmenené. Všetkých 50 000 riadkov sa spracuje v priebehu minút.
Pravidlá pre každú entitu osobitne vám umožňujú zaobchádzaś s každým typom dat inak. SSN sa stanú maskovanými reťazcami. Adresy sa stanu hodnotami na úrovni mesta. Osobné e-mailové adresy sa stanu záplnami na základe roly.
Táto výzva nie je jedinečná pre Excel. Každý formát súboru má vlastné chybové módy. Pozrite, ako fragmentácia formátov ovplyvňuje detekciu PII naprieč typmi súborov.
Tri pravidlá GDPR jednym prechodom
Anonymizácia tabuľky splní tri pravidlá Článku 5 naraz.
Minimalizácia dat (čl. 5(1)(c)). Príjemcovi sa zdieľajú iba stĺpce, ktoré potrebuje. Identifikačné stĺpce sa vymažú.
Obmedzenie uloženia (čl. 5(1)(e)). Pôvodný súbor sa uchováva na právnu retenciu. Čistá kópia sa zdieľa s kratšou dobou retencie.
Integrita a dôvernosť (čl. 5(1)(f)). Žiadne identifikačné data neopustia kontrolnú zónu. Von ide iba čistá kópia.
Audit log z každého behu je tiež vaším záznamom podľa Článku 5(2). Ukazuje, ktore pravidlo sa vztahovalo na každý súbor a každú bunku.
Pre tímy spracúvajúce veľké objemy DSAR v prísnych lehotách pozrite GDPR DSAR batch spracovanie vo veľkom meradle.