Tabulky nejsou dokumenty
Soubor Word je proud textu. Soubor Excel je něco jiného. Buňky odkazují na jiné buňky. Vzorce operují s rozsahy. Kontingenční tabulky seskupují pojmenovaná data. Makra procházejí celým sešitem. Většina nástrojů pro redigování zachází s Excelem jako s textovým dokumentem. To je špatný přístup.
Uveďme jednoduchý příklad. Ve sloupci A jsou jména zákazníků. Sloupec D obsahuje vzorec: =SVYHLEDAT(A2; TabulkaZakaznikuů; 5; NEPRAVDA). Tento vzorec vyhledá zůstatek na účtu podle jména. Nahradíte jméno ve sloupci A. Vzorec ani vyhledávací tabulku neaktualizujete. Vzorec stále vrátí skutečný zůstatek pro původní jméno. Soubor vypadá čistě. Není.
Toto je v podnikových souborech Excel běžné. Data existují ve vztazích — nejen v buňkách. Nahrazení hodnot buněk bez sledování těchto vztahů ponechává osobní údaje odhalené.
GDPR Článek 28 a sdílení navenek
Článek 28 GDPR upravuje sdílení dat se zpracovateli. Pokud posíláte osobní údaje konzultantovi, dodavateli nebo auditorovi, musíte mít zavedeny technické záruky.
Řekněme, že potřebujete sdílet soubor se 50 000 zákaznickými záznamy s analytickým dodavatelem. Export do PDF odstraní vzorce. U velkých souborů se složitým formátováním navíc způsobí problémy. CSV export také odstraní vzorce a kontingenční tabulky. Ani jedno z toho nedodavateli poskytne použitelnou datovou sadu.
Jediná funkční možnost: anonymizace přímo v nativním formátu Excel. Nahraďte identifikující hodnoty. Zachovejte strukturu. Dodavatel dostane funkční soubor. Vy splníte požadavek GDPR na technické záruky.
Vzduchově oddělená prostředí
67 % vládních a obranných RFP uvádí požadavky na vzduchově oddělená prostředí (DISA 2024). Obranní dodavatelé zpracovávají osobní data zaměstnanců, logistické záznamy a nákupní soubory v Excelu. Nemohou používat cloudové nástroje. Data nesmějí opustit řízené sítě.
Desktopová aplikace tento problém řeší. Zpracovává soubory Excel přímo na místním počítači. Během zpracování nedochází k žádným síťovým voláním. Výstupní soubor nikdy neopustí vzduchově oddělené prostředí. Interní týmy mohou sdílet čisté soubory v rámci řízené sítě.
To splňuje technický profil vyžadovaný pro soulad s vládními smlouvami.
Tři úrovně práce s buňkami
Kvalitní anonymizace Excelu pracuje současně na třech úrovních.
Úroveň hodnot: Hledání a nahrazování osobních údajů v jednotlivých buňkách. Jména, e-maily, telefonní čísla a národní identifikátory jsou označeny pomocí stejného detekčního enginu jako při zpracování dokumentů.
Úroveň vzorců: Hledání buněk, jejichž vzorce odkazují na buňky s osobními údaji. Aktualizace těchto odkazů tak, aby ukazovaly na anonymizované hodnoty. Nebo nahrazení vzorce jeho výsledkem, aby se zabránilo úniku osobních údajů přes vzorce.
Úroveň struktury: Vymazání mezipaměti dat kontingenčních tabulek. Zpracování skrytých řádků a sloupců. Ošetření kódu maker VBA, který používá konkrétní adresy nebo hodnoty buněk.
Všechny tři úrovně musejí běžet společně. Oprava hodnot bez opravy vzorců ponechá osobní údaje na místě. Oprava vzorců bez vymazání mezipaměti udělá totéž.
Tento problém se týká každého formátu souboru. Viz jak fragmentace formátů ovlivňuje detekci osobních údajů pro širší pohled.
Pro týmy pracující se strukturovanými daty na úrovni API viz minimalizace dat GDPR v real-time API.
Pokud váš tým zpracovává rozsáhlé exporty DSAR, viz dávkové zpracování GDPR DSAR ve velkém měřítku pro vzory workflow, které se zde uplatní.