Прогалина GDPR в Excel
Інструменти редагування PDF не працюють з файлами Excel. Це створює прогалину у відповідності. В корпоративних умовах вона зачіпає кожну команду HR, фінансів і операцій.
Кількість запитів на право доступу відповідно до GDPR зросла на 180% між 2021 і 2024 роком (Річний звіт EDPB). Коли надходить запит DSAR, ви повинні поділитися персональними даними запитувача. Водночас ви повинні захистити дані всіх інших у тому самому файлі. Експортувати окремі рядки недостатньо. Інші записи залишаються видимими. Належна відповідність DSAR означає анонімізацію всіх даних, що не стосуються запитувача.
Середнє оброблення DSAR займає 12 годин вручну. При 200 запитах на місяць це 2 400 годин персоналу. Ручне оброблення не масштабується.
Що повинна охоплювати анонімізація в Excel
Електронні таблиці мають проблеми, для яких текстові інструменти не призначені.
Приховані рядки та стовпці. Файли Excel часто містять приховані рядки та стовпці. У них можуть бути чернеткові записи або оригінальні значення. Інструмент, що читає лише видимі комірки, пропустить PII у прихованих областях.
Посилання у формулах. Комірка може відображати значення, побудоване з інших комірок. Очищення вихідних комірок не оновлює результат формули. Оригінальний PII залишається у результаті формули.
Кеш зведеної таблиці. Зведені таблиці Excel зберігають копію вихідних даних. Очищення вихідного аркуша не очищає кеш. Будь-хто, хто має файл, може прочитати кешовані дані.
Крос-аркушні посилання. Ім'я на Аркуші 1 може з'являтися у формулі на Аркуші 3. Очищення Аркуша 1 без оновлення Аркуша 3 може розкрити оригінальне значення через формулу.
Інструмент корпоративного рівня для відповідності повинен обробляти всі аркуші — включаючи приховані — і оновлювати всі посилання у формулах.
Сценарій HR: обмін 50 000 записів співробітників
Німецький виробник повинен поділитися 50 000 записів співробітників із зовнішнім консультантом. Стаття 28 GDPR вимагає технічних засобів контролю при передачі даних оператору. Файл містить 37 стовпців: імена, домашні адреси, зарплати, рейтинги та дані про медичні відпустки.
Ручна анонімізація 50 000 рядків неможлива в будь-якому вікні відповідності.
Надбудова Word та Excel працює безпосередньо в Microsoft Excel — без жодного експорту. Виявлення PII виконується на всіх видимих і прихованих аркушах. Імена стають послідовними псевдонімами. Те саме ім'я в двох комірках отримує той самий токен. Аналітичні зв'язки зберігаються. Адреси замінюються відповідними типу заповнювачами. Зарплати залишаються без змін. Всі 50 000 рядків обробляються за хвилини.
Правила для кожної сутності дозволяють по-різному обробляти кожен тип даних. SSN замінюються замаскованими рядками. Адреси стають значеннями рівня міста. Особисті електронні адреси — рольовими заповнювачами.
Цей виклик не унікальний для Excel. Кожен формат файлів має власні режими збоїв. Дивіться, як фрагментація форматів впливає на виявлення PII в різних типах файлів.
Три правила GDPR за один прохід
Анонімізація таблиць виконує три правила Статті 5 одночасно.
Мінімізація даних (Ст. 5(1)(c)). Лише стовпці, потрібні одержувачу, передаються. Ідентифікуючі стовпці очищаються.
Обмеження зберігання (Ст. 5(1)(e)). Оригінальний файл зберігається для юридичного утримання. Чиста копія надається з коротшим терміном утримання.
Цілісність і конфіденційність (Ст. 5(1)(f)). Жодні ідентифікуючі дані не виходять із зони контролю. Лише чиста копія передається.
Журнал аудиту кожного запуску є також вашим записом за Статтею 5(2). Він показує, яке правило застосовувалося до кожного файлу та кожної комірки.
Для команд, що обробляють великі обсяги DSAR в стислі строки, дивіться пакетну обробку GDPR DSAR у масштабі.