Табелите не се документи
Word датотеката е текстуален тек. Excel датотеката е нешто сосема различно. Ќелиите покажуваат кон други ќелии. Формулите работат со опсези. Пивот-табелите групираат именувани податоци. Макроата поминуваат низ целата работна книга. Повеќето алатки за редактирање го третираат Excel како текстуален документ. Тоа е погрешен модел.
Еве едноставен пример. Колона А содржи имиња на клиенти. Колона Д ја содржи оваа формула: =VLOOKUP(A2, CustomerTable, 5, FALSE). Оваа формула го бара салдото на сметката по име. Го замените името во колона А. Ја не ажурирате формулата ни табелата за пребарување. Формулата сепак го враќа вистинското салдо за оригиналното ime. Датотеката изгледа чисто. Но не е.
Тоа е вообичаено во деловните Excel датотеки. Податоците живеат во врски — а не само во ќелии. Замената на вредностите на ќелиите без следење на тие врски оставаат лични податоци изложени.
Член 28 од GDPR и надворешното споделување
Член 28 од GDPR го опфаќа споделувањето на податоци со обработувачите. Ако испраќате лични податоци до консултант, добавувач или ревизор, потребно е да имате технички заштитни мерки.
Да речеме дека треба да споделите датотека со 50.000 редови на клиенти со аналитички добавувач. PDF извозот ги отстранува формулите. Исто така ги кршел големите датотеки со сложено форматирање. CSV ги отстранува формулите и пивот-табелите исто така. Ниедното не му дава на добавувачот употреблив сет на податоци.
Единствената опција која функционира: анонимизирање во матичниот Excel формат. Ги замените идентификациските вредности. Ја задржате структурата. Добавувачот добива работна датотека. Ја исполнувате барањето за заштитни мерки на GDPR.
Средини со воздушна изолација
67% од владините и одбранбените RFP барања го цитираат барањето за средина со воздушна изолација (DISA 2024). Одбранбените изведувачи работат со персонални податоци, логистички записи и набавни датотеки во Excel. Не можат да користат облак алатки. Податоците не можат да ја напуштат контролираната мрежа.
Десктоп апликацијата го решава ова. Ги обработува Excel датотеките на локалната машина. За време на обработката не се прават мрежни повици. Излезната датотека никогаш не ја напушта средината со воздушна изолација. Внатрешните тимови можат да споделуваат чисти датотеки во рамките на контролираната мрежа.
Ова ги исполнува техничките барања потребни за усогласеност со владините договори.
Три нивоа на разузнавање на ќелиите
Добрата анонимизација на Excel работи на три нивоа истовремено.
Ниво на вредност: Наоѓање и замена на лични податоци во поединечни ќелии. Имиња, е-пошти, телефонски броеви и национални идентификатори се означуваат со истиот механизам за откривање кој се користи за обработка на документи.
Ниво на формули: Пронаоѓање на ќелии чии формули ги референцираат ќелиите со лични податоци. Ажурирање на тие референци за да покажуваат кон анонимизираните вредности. Или замена на формулата со нејзиниот резултат за да се спречи изложување на лични податоци преку формули.
Ниво на структура: Бришење на кешот со податоци на пивот-табели. Обработка на скриени редови и колони. Справување со VBA код на макроа кои користат специфични адреси или вредности на ќелии.
Сите три нивоа мора да работат заедно. Поправката на вредностите без поправање на формулите ги оставаат личните податоци на место. Поправката на формулите без бришење на кешот го прави истото.
Овој предизвик се простира на секој формат на датотека. Погледнете како фрагментацијата на форматот влијае на откривањето лични податоци за поширок преглед.
За тимови кои работат со структурирани податоци на API ниво, погледнете минимизација на податоците по GDPR во API во реално време.
Ако вашиот тим управува со големи DSAR извози, погледнете партиска обработка на GDPR DSAR во голем обем за работни шаблони применливи тука.