Mezera Excelu v oblasti GDPR
Nástroje pro redigování PDF nefungují na soubory Excel. To vytváří mezeru v souladu s předpisy. V podnikovém prostředí se týká každého HR, finančního a provozního týmu.
Počet žádostí o přístup k osobním údajům podle GDPR vzrostl o 180 % mezi lety 2021 a 2024 (výroční zpráva EDPB). Když dorazí DSAR, musíte sdílet osobní údaje žadatele. Zároveň musíte chránit údaje všech ostatních ve stejném souboru. Exportovat konkrétní řádky nestačí. Ostatní záznamy zůstávají viditelné. Řádný soulad s DSAR znamená anonymizovat všechna data, která žadateli nepatří.
Průměrné ruční zpracování jednoho DSAR trvá 12 hodin. Při 200 DSAR měsíčně to představuje 2 400 pracovních hodin. Ruční zpracování se nedá škálovat.
Co musí anonymizace Excelu pokrývat
Tabulky mají problémy, pro které textové nástroje nejsou konstruovány.
Skryté řádky a sloupce. Soubory Excel často skrývají řádky a sloupce. Mohou obsahovat konceptní záznamy nebo původní hodnoty. Nástroj čtoucí pouze viditelné buňky přehlédne OÚ ve skrytých oblastech.
Odkazy vzorců. Buňka může zobrazovat hodnotu sestavenou z jiných buněk. Vymazání zdrojových buněk neaktualizuje výstup vzorce. Původní OÚ zůstávají ve výsledku vzorce.
Mezipaměť kontingenční tabulky. Kontingenční tabulky Excelu ukládají kopii zdrojových dat. Vymazání zdrojového listu mezipaměť nevymaže. Kdokoli s přístupem k souboru může uložená data přečíst.
Mezisešitové vazby. Jméno na Listu 1 se může vyskytovat ve vzorci na Listu 3. Vymazání Listu 1 bez aktualizace Listu 3 může původní hodnotu prostřednictvím vzorce odhalit.
Nástroj splňující požadavky souladu musí zpracovat všechny listy — včetně skrytých — a aktualizovat všechny odkazy vzorců.
HR případ: sdílení 50 000 záznamů zaměstnanců
Německý výrobce musí sdílet 50 000 záznamů zaměstnanců s externím poradcem. Článek 28 GDPR vyžaduje technické kontroly při sdílení dat se zpracovatelem. Soubor má 37 sloupců: jména, adresy bydliště, platy, hodnocení a data pracovní neschopnosti.
Ruční anonymizace 50 000 řádků není v jakémkoli lhůtě souladu proveditelná.
Doplněk pro Word a Excel funguje přímo v Microsoft Excelu — bez nutnosti exportu. Detekce OÚ probíhá napříč všemi viditelnými i skrytými listy. Jména se stávají konzistentními pseudonymy. Stejné jméno ve dvou buňkách dostane stejný token. Analytické vazby zůstávají zachovány. Adresy jsou nahrazeny typově odpovídajícími zástupnými hodnotami. Platy zůstávají beze změny. Všech 50 000 řádků je zpracováno během minut.
Pravidla pro každou entitu umožňují zacházet s každým typem dat odlišně. Rodná čísla se stávají maskovanými řetězci. Adresy jsou nahrazeny hodnotami na úrovni města. Osobní e-mailové adresy se stávají funkčními zástupnými adresami.
Tato výzva není výhradně problémem Excelu. Každý formát souborů má své vlastní způsoby selhání. Přečtěte si, jak fragmentace formátů ovlivňuje detekci OÚ napříč typy souborů.
Tři pravidla GDPR v jednom průchodu
Anonymizace tabulek splňuje tři pravidla článku 5 najednou.
Minimalizace dat (čl. 5 odst. 1 písm. c)). Příjemci jsou sdíleny pouze sloupce, které potřebuje. Identifikující sloupce jsou vymazány.
Omezení uložení (čl. 5 odst. 1 písm. e)). Původní soubor je uchován pro zákonné účely. Čistá kopie je sdílena s kratší dobou uchování.
Integrita a důvěrnost (čl. 5 odst. 1 písm. f)). Žádné identifikující údaje neopouštějí kontrolovanou zónu. Vychází pouze čistá kopie.
Auditní protokol z každého průběhu je zároveň vaším záznamem podle článku 5 odst. 2. Ukazuje, které pravidlo bylo aplikováno na každý soubor a každou buňku.
Pro týmy zpracovávající velké objemy DSAR v přísných termínech viz dávkové zpracování DSAR GDPR ve velkém měřítku.