Tabulky nie su dokumenty
Súbor Word je textový prúd. Súbor Excel je nieco iné. Bunky odkazujú na iné bunky. Vzorce pracujú s rozsahmi. Kontingenčné tabulky zoskupujú pomenované dáta. Makrá prechádzajú celým zoširom. Väcšina nástrojov na redakciu zaobchádza s Excelom ako s textovým dokumentom. To je nesprávny model.
Tu je jednoduchý príklad. Stlpec A obsahuje mená zákazníkov. Stlpec D má tento vzorec: =VLOOKUP(A2, CustomerTable, 5, FALSE). Tento vzorec vyhladáva zostatok na úcte podla mena. Nahradíte meno v stlpci A. Neaktualizujete vzorec ani vyhladávaciu tabulku. Vzorec stále vracia skutocný zostatok pre pôvodné meno. Súbor vyzerá cisto. Nie je.
Toto je bezné v podnikových súboroch Excel. Dáta zijú vo vzájomných vztahoch -- nielen v bunkách. Nahradenie hodnôt buniek bez sledovania týchto vztahov ponecháva osobné údaje odhalené.
GDPR Clanok 28 a externé zdielanie
Clanok 28 GDPR sa týka zdielania údajov so spracovatelmi. Ak posielate osobné údaje konzultantovi, dodávatelovi alebo audítorovi, musíte mít zavedené technické záruky.
Povedzme, ze potrebujete zdielat súbor s 50 000 riadkami zákazníkov s analytickým dodávatelom. Export do PDF odstraní vzorce. Taktiez rozlomí velké súbory so zlozitým formátovaním. CSV odstraní vzorce aj kontingenčné tabulky. Ani jedna moznost dodávatelovi neposkytne pouzitelný súbor.
Jediná fungujuca moznost: anonymizovat priamo v natívnom formáte Excel. Nahradt identifikujúce hodnoty. Zachovat štruktúru. Dodávatel dostane funkcionálny súbor. Vy splníte poziadavku záruky podla GDPR.
Vzduchovo odizolované prostredia
67 % vládnych a obranných zadávacích dokumentov (RFP) uvádza poziadavky na vzduchovo odizolované prostredie (DISA 2024). Dodávatelia obrany spracúvajú personálne údaje, logistické záznamy a obstarávacie súbory v Exceli. Nemôzu pouzívat cloudové nástroje. Dáta nemôzu opustit kontrolovanú siet.
Desktop App to rieši. Spracúva súbory Excel na lokálnom pocítaci. Pocas spracovania nedochádza k ziadnym sietovým volaniam. Výstupný súbor nikdy neopustí vzduchovo odizolované prostredie. Interné tímy môzu zdielat cistené súbory v rámci kontrolovanej siete.
To spna technický profil vyzadovaný pre súlad so štátnymi zákazkami.
Tri úrovne inteligencie buniek
Dobrá anonymizácia Excelu pracuje simultánne na troch úrovniach.
Úroven hodnôt: Nájdenie a nahradenie osobných údajov v jednotlivých bunkách. Mená, e-maily, telefónne císla a národné identifikátory su oznacené pomocou rovnakého detekčného enginu ako pri spracovaní dokumentov.
Úroven vzorcov: Nájdenie buniek, ktorých vzorce odkazujú na bunky s osobnými údajmi. Aktualizácia týchto odkazov tak, aby smerovali na anonymizované hodnoty. Alebo nahradenie vzorca jeho výsledkom, cím sa zabráni úniku osobných údajov prostredníctvom vzorca.
Úroven štruktúry: Vymazanie vyrovnávacej pamäte kontingenčných tabuliek. Spracovanie skrytých riadkov a stlpcov. Ošetrenie kódu makra VBA, ktorý pouzíva konkrétne adresy buniek alebo hodnoty.
Všetky tri úrovne musia prebiehat spolocne. Oprava hodnôt bez opravy vzorcov ponecháva osobné údaje na mieste. Oprava vzorcov bez vymazania vyrovnávacích pamätí tiez.
Táto výzva sa týka kazdého formátu súborov. Pozrite sa na vplyv fragmentácie formátov na detekciu osobných údajov pre širší pohlad.
Pre tímy pracujúce so štruktúrovanými dátami na úrovni API si precítajte minimalizáciu dát GDPR v reálnom case v rozhraniach API.
Ak vás zaujíma hromadné spracovanie exportov DSAR, pozrite si hromadné spracovanie GDPR DSAR v mierke.