Пробел Excel в GDPR
Инструменты редактирования PDF не работают с файлами Excel. Это создаёт пробел в соответствии, затрагивающий каждый HR-, финансовый и операционный отдел в корпоративной среде.
Запросы на реализацию права на доступ по GDPR выросли на 180% с 2021 по 2024 год (Годовой отчёт EDPB). При получении DSAR вы обязаны передать персональные данные заявителя, одновременно защитив данные всех остальных в том же файле. Экспорт конкретных строк недостаточен — остальные записи остаются видимыми. Надлежащее соответствие DSAR означает анонимизацию всех данных, не относящихся к заявителю.
Средний DSAR занимает 12 часов при ручной обработке. При 200 DSAR в месяц это 2 400 часов персонала. Ручная обработка не масштабируется.
Что должна охватывать анонимизация Excel
Таблицы создают проблемы, для которых текстовые инструменты не предназначены.
Скрытые строки и столбцы. Файлы Excel часто скрывают строки и столбцы — они могут содержать черновые записи или исходные значения. Инструмент, читающий только видимые ячейки, пропустит PII в скрытых областях.
Ссылки в формулах. Ячейка может отображать значение, вычисленное из других ячеек. Очистка ячеек-источников не обновляет результат формулы. Исходный PII остаётся в результате вычисления.
Кэш сводных таблиц. Excel хранит копию исходных данных в сводных таблицах. Очистка исходного листа не очищает кэш. Любой владелец файла может прочитать кэшированные данные.
Межлистовые ссылки. Имя на Листе 1 может фигурировать в формуле на Листе 3. Очистка Листа 1 без обновления Листа 3 может раскрыть исходное значение через формулу.
Инструмент уровня соответствия должен обрабатывать все листы — включая скрытые — и обновлять все ссылки в формулах.
Случай использования HR: передача 50 000 записей сотрудников
Немецкий производитель обязан передать 50 000 записей сотрудников внешнему консультанту. Статья 28 GDPR требует технических средств контроля при передаче данных обработчику. Файл содержит 37 столбцов: имена, домашние адреса, зарплаты, оценки, данные о больничных.
Ручная анонимизация 50 000 строк невозможна в установленные сроки соответствия.
Инструмент, работающий непосредственно в Microsoft Excel, выполняет обнаружение PII по всем видимым и скрытым листам. Имена превращаются в согласованные псевдонимы: одно и то же имя в двух ячейках получает один и тот же токен — аналитические связи сохраняются. Адреса заменяются типово-соответствующими заполнителями. Зарплаты остаются без изменений. Все 50 000 строк обрабатываются за минуты.
Правила для каждого типа сущности позволяют обращаться с каждым типом данных по-разному. SSN превращаются в замаскированные строки. Адреса сводятся до уровня города. Личные адреса электронной почты заменяются ролевыми заполнителями.
Три правила GDPR в одном проходе
Анонимизация таблиц выполняет три требования Статьи 5 одновременно.
Минимизация данных (Ст. 5(1)(c)). Только столбцы, необходимые получателю; идентифицирующие столбцы очищены.
Ограничение хранения (Ст. 5(1)(e)). Исходный файл хранится для правового учёта. Чистая копия передаётся с более коротким сроком хранения.
Целостность и конфиденциальность (Ст. 5(1)(f)). Идентифицирующие данные не покидают зону контроля. Только чистая копия уходит получателю.
Журнал аудита каждого прогона является также вашей записью по Статье 5(2): он показывает, какое правило применялось к каждому файлу и каждой ячейке.