Електронните Таблици Не Са Документи
Word файлът е текстов поток. Excel файлът е нещо друго. Клетките препращат към други клетки. Формулите работят върху диапазони. Обобщените таблици групират именувани данни. Макросите обхождат цялата работна книга. Повечето инструменти за редактиране третират Excel като текстов документ. Това е грешен модел.
Ето прост пример. Колона A съдържа имена на клиенти. Колона D има формулата: =VLOOKUP(A2, CustomerTable, 5, FALSE). Тази формула търси баланса по сметката по ime. Замествате имената в колона A. Не актуализирате формулата или таблицата за търсене. Формулата все още връща реалния баланс за оригиналното имя. Файлът изглежда чист. Не е.
Това е честа ситуация в корпоративните Excel файлове. Данните живеят в отношения - не само в клетки. Заместването на стойности в клетки без проследяване на тези отношения оставя личните данни изложени.
Член 28 от GDPR и Споделяне с Трети Страни
Млен 28 от GDPR обхваща споделянето на данни с обработващи. Ако изпращате лични данни на консултант, доставчик или одитор, трябва да имате технически мерки за защита.
Представете си, че трябва да споделите файл с 50 000 реда клиенти с аналитичен доставчик. Експортът в PDF премахва формулите. Разваля и големи файлове с комплексно форматиране. CSV премахва формулите и обобщените таблици също. Нито едното, нито другото дава на доставчика използваем набор от данни.
Единственият вариант, който работи: анонимизиране в родния Excel формат. Заместете идентифициращите стойности. Запазете структурата. Доставчикът получава работещ файл. Вие отговаряте на изискването за технически мерки по GDPR.
Среди без Достъп до Интернет
67% от правителствените и отбранителни обществени поръчки цитират изисквания за среди без достъп до интернет (DISA 2024). Отбранителните изпълнители обработват данни за персонала, логистични записи и договорни файлове в Excel. Не могат да използват облачни инструменти. Данните не могат да напуснат контролираната мрежа.
Десктоп приложението решава това. То обработва Excel файлове на локалната машина. По време на обработката не се правят мрежови извиквания. Изходният файл никога не напуска средата без достъп до интернет. Вътрешните екипи могат да споделят чисти файлове в рамките на контролираната мрежа.
Това отговаря на техническия профил, изискван за спазване на правителствените договори.
Три Нива на Клетъчна Интелигентност
Доброто анонимизиране на Excel работи едновременно на три нива.
Ниво стойност: Намиране и заместване на лични данни в отделни клетки. Имена, имейли, телефонни номера и национални ИД са маркирани чрез същия двигател за детекция като при обработката на документи.
Ниво формула: Намиране на клетки, чиито формули препращат към клетки с лични данни. Актуализиране на тези препратки да сочат към анонимизираните стойности. Или замяна на формулата с нейния резултат за спиране на разкриването на лични данни чрез формули.
Ниво структура: Изчистване на кешираните данни на обобщените таблици. Обработка на скрити редове и колони. Обработка на VBA макро код, използващ конкретни адреси или стойности на клетки.
И трите нива трябва да работят заедно. Оправянето на стойностите без оправяне на формулите оставя личните данни на място. Оправянето на формулите без изчистване на кешовете прави същото.
Този проблем обхваща всички файлови формати. Вижте как фрагментацията на форматите влияе на детекцията на лични данни за по-широка гледна точка.
За екипи, работещи със структурирани данни на API ниво, вижте минимизиране на данните по GDPR в реално-временни API.
Ако вашият екип изпълнява мащабни DSAR експорти, вижте партидна обработка на GDPR DSAR в мащаб за приложими работни процеси.