Пропускът в съответствието на електронните таблици
Инструментите за редактиране на PDF не обработват Excel електронни таблици. Този единствен факт създава системна празнина в съответствие за организации, които съхраняват лични данни във формат Excel — което в корпоративна среда означава почти всеки отдел по човешки ресурси, финансов екип и оперативен отдел.
Данните от годишния отчет на EDPB показват, че заявките за право на достъп GDPR са се увеличили със 180% от 2021 г. до 2024 г.. Организациите, получаващи DSAR, трябва да предоставят личните данни на заявителя в преносим формат, като същевременно гарантират, че данните от трети страни, включени в същия набор от данни, са подходящо защитени. За набор от данни за служител, съхраняван в Excel, стандартният отговор — експортиране на специфични редове — все още излага данните на други служители в същия файл. Правилното съответствие на DSAR изисква анонимизиране на всеки запис на данни, които не са заявители.
Средно DSAR отнема 12 часа за ръчна обработка. За организация, която получава 200 DSARs на месец – скромен обем за средно голяма компания – това представлява 2400 часа персонал месечно в режийни разходи за съответствие. Ръчният подход не съответства на обема на заявките за проектите за данни EDPB за остатъка от това десетилетие.
Какво всъщност изисква Excel анонимизирането
Анонимизирането на електронни таблици представлява предизвикателство, с което инструментите за редактиране на PDF не са проектирани да се справят.
Скрити редове и колони: Excel файловете обикновено съдържат скрити редове (чернови данни, филтрирани записи) и скрити колони (междинни изчисления, оригинални стойности преди трансформация). Инструмент за редактиране, който обработва само видими клетки, оставя скритите PII непокътнати. Excel анонимизатор със степен на съответствие трябва да обработва всички листове, включително скритите.
Вградени формули: Клетките, съдържащи формули, които препращат към PII в други клетки, може да показват извлечени стойности, докато самата формула препраща към оригиналните данни. Анонимизирането на показаната стойност без актуализиране на препратката към формулата оставя оригиналния PII достъпен за всеки, който проверява формулата.
**Кеш на обобщената таблица: ** Excel обобщените таблици кешират основните данни, използвани за генериране на обобщената таблица. Анонимизирането на изходния лист с данни не изчиства автоматично обобщения кеш. Противопоставящ се потребител, който получава „анонимизиран“ файл Excel, може да провери основния кеш, за да възстанови оригиналните данни.
Препратки към кръстосани листове: Enterprise Excel файловете рутинно съдържат препратки към клетки в кръстосани листове. Името на служител може да се появи на лист 1 и да бъде посочено в изчисленията на лист 3. Анонимизирането на лист 1 без актуализиране на препратките към лист 3 оставя препратка към анонимизираните данни, които могат да разкрият оригиналната стойност чрез проверка на формулата.
Случаят на използване на отдела по човешки ресурси
Германска производствена компания трябва да сподели досиета на 50 000 служители с външен консултант по възнаграждение за проект за сравнителен анализ. GDPR Член 28 изисква споделянето на лични данни с обработващ (външен консултант) да включва подходящ технически контрол. Файлът Excel съдържа 37 колони, включително имена, лични имейл адреси, домашни адреси, заплати, оценки за ефективност и досиета за медицински отпуски.
Ръчното анонимизиране на 50 000 реда в 37 колони не е осъществимо в нито един период от време за съответствие. Добавките Word и Excel обработват електронната таблица естествено — в Microsoft Excel, без експортиране или преобразуване. Откриването на PII на ниво клетка идентифицира личните данни във всички видими и скрити листове. Имената се заменят с псевдоними; адреси с подходящи за типа контейнери; заплатите се запазват (не PII), докато свързаните лични идентификатори се премахват. Анонимизирането обработва 50 000 реда за минути, а не за дни.
Конфигурацията за всеки обект позволява различно третиране на различни типове данни: имена, заменени с последователни псевдоними (едно и също име в различни клетки получава един и същ псевдоним, запазвайки аналитичната полезност); SSN, заменени с маскирани низове; адресите са заменени с приближения само за града; лични имейл адреси, заменени с контейнери, базирани на роли.
Източници:
- [EDPB Данни от годишния отчет: GDPR Заявките за право на достъп се увеличиха със 180% 2021-2024] (https://edpb.europa.eu/our-work-tools/our-documents/annual-report_en)
- [Idox Research: Excel GDPR предизвикателства за съответствие и анонимизиране на електронни таблици] (https://www.idox.ai/blog/How-to-Redact-Sensitive-Data-in-Excel)
- GDPR член 28: изисквания за споделяне на данни от процесора