Нідерландська Autoriteit Persoonsgegevens (AP) оштрафувала Uber на €290 мільйонів у серпні 2024 року. Підставою стало передавання даних водіїв на сервери в США без дійсної угоди про передачу. Жодна справа за GDPR не породила більшого штрафу за транскордонну передачу даних. AP також опрацювала понад 21 400 скарг у 2023 році, що робить її одним із найзавантаженіших регуляторів даних в Європі.
Що AP встановила у справі Uber
Uber збирав дані від водіїв у Нідерландах та Франції. Дані включали: геолокаційну історію, документи, що посвідчують особу, записи про заробіток, відомості про дорожні інциденти та податкові документи. Усе це передавалося на сервери в США. AP визнала метод передачі недійсним.
Три висновки стали вирішальними:
- Слабкий механізм передачі: Uber використовував Binding Corporate Rules (BCR). AP встановила, що вони не охоплювали обсяг і чутливість задіяних даних водіїв.
- Відсутність оцінки впливу на передачу (TIA): Uber не довів, що законодавство США забезпечує збереження погоджених засобів захисту передачі.
- Чутливі дані у сукупності: геолокаційна історія, оплата та оцінки продуктивності разом дають детальний профіль кожного водія. AP розцінила таку комбінацію як еквівалент чутливих персональних даних.
Справа Uber встановлює чітке правило. Дані персоналу та підрядників, що передаються до США, потребують такої самої TIA і додаткових заходів, що й споживчі дані.
Пріоритети виконання AP на 2025 рік
Оновлено для 2026 року
AP визначила три сфери, за якими пильно стежитиме у 2025 році.
Моніторинг персоналу: інструменти відстеження віддаленої роботи — головний об'єкт уваги. Це стосується журналів продуктивності, знімків екрана, реєстрації натискань клавіш і засобів геолокації. Перш ніж запроваджувати будь-який такий інструмент, компанії мають задокументувати, чому вони відмовилися від менш інтрузивних варіантів.
Транскордонні передачі даних: після рішення у справі Uber AP перевіряє механізми передачі. Компанії, що використовують сервіси з США, Азії та інших країн, що не мають рішення про адекватність, підпадають під перевірку. Будь-яка компанія, що використовує американські програмні інструменти для HR, управління проєктами або роботи з клієнтами, повинна мати актуальну TIA.
Автоматизовані рішення: системи кредитного скорингу на основі ШІ, фільтри найму та системи оцінки ефективності активують обов'язки за Статтею 22. AP контролює організації, що ухвалюють автоматизовані рішення без реального кроку людської перевірки. Під захистом мають бути і працівники, і споживачі.
BSN: захищений національний ідентифікатор
Burgerservicenummer (BSN) — це 9-значний ідентифікаційний номер, що використовується в Нідерландах. Він перевіряється за алгоритмом Elfproef (перевірка на одинадцять). Щоб виконати перевірку: помножте кожну цифру на ваговий коефіцієнт від 9 до −1, складіть результати — загальна сума повинна ділитися на 11 без остачі.
Закон про BSN (Wet algemene bepalingen burgerservicenummer) обмежує використання BSN конкретними правовими контекстами: оподаткування, охорона здоров'я, державне управління та нарахування заробітної плати роботодавцем. Використання BSN поза цими контекстами спричиняє застосування Закону про BSN. Поверх цього накладається відповідальність за GDPR.
Чому загальні інструменти пропускають BSN: багато NLP-інструментів не включають перевірку Elfproef. Без неї будь-який 9-значний рядок позначається як можливий BSN. Це породжує хибнопозитивні результати у фінансових і адміністративних документах. Неправильно введені BSN також пропускаються: вони не проходять перевірку, але виглядають як дійсний шаблон. Дивіться наш посібник з виявлення EU national tax ID та PII для повного порівняння форматів европейських ідентифікаторів.
NER для нідерландомовних документів
Нідерландська мова (Nederlands) має особливості, які стають пасткою для моделей, навчених на англійській.
Складні слова: нідерландська мова з'єднує слова разом. Persoonsgegevens (персональні дані) і Burgerservicenummer (ідентифікаційний номер громадянина) — кожне є одним словом. Моделі, побудовані для англійської, часто розбивають їх у неправильному місці. Це руйнує виявлення сутностей.
Закінчення імен: суфікси -je і -tje зустрічаються в іменах — Annetje, Hansje. Моделі розпізнавання імен повинні обробляти як базову форму, так і скорочену.
Формати адрес: типи вулиць включають Straat, Laan, Weg, Plein і Gracht. Поштові індекси складаються з чотирьох цифр і двох літер (приклад: 1234 AB). Кожен код відповідає одній вулиці, тому розкриває більше інформації, ніж більшість европейських поштових індексів.
Формат IBAN: нідерландські IBAN складаються з 18 символів: NL + 2 контрольні цифри + 4-літерний код банку + 10-значний номер рахунку. У країні широко використовуються безготівкові платежі, тому фінансові документи містять багато IBAN. Щодо методів підрахунку впевненості для різних типів ідентифікаторів, дивіться бінарне виявлення PII та підрахунок впевненості.
Технічний контрольний список для відповідності AP
Для дотримання поточних стандартів AP системи обробки даних потребують:
- Виявлення BSN з Elfproef — простого пошуку за шаблоном недостатньо
- NER для нідерландської мови — модель на кшталт spaCy
nl_core_newsобробляє складні слова та скорочені імена - Виявлення IBAN — з урахуванням формату, а не узагальнено
- Записи про субпроцесорів для всіх транскордонних передач
- TIA для постачальників із США — активний пріоритет аудиту AP після рішення у справі Uber
Після справи Uber TIA для постачальників із США є базовою вимогою, а не найкращою практикою. Повний розбір рішення та його наслідків для передачі даних дивіться у посібнику AP щодо штрафу Uber та транскордонної передачі.