anonym.legal
Назад к блогуGDPR и соблюдение

Разрыв идентификаторов ЕС: почему инструменты PII...

Универсальные инструменты PII созданы на основе американских идентификаторов.

April 20, 20268 мин чтения
EU identifier gapSteuer-ID detectionFrench NIR anonymizationSwedish PersonnummerNordic identifier GDPR

Почему европейские идентификаторы структурно отличаются

Инструменты PII, созданные в США, предполагают структуру идентификаторов на основе американских форматов: номера социального страхования (AAA-BB-CCCC), номера телефонов США (XXX-XXX-XXXX), форматы водительских удостоверений по штатам и почтовые индексы США (XXXXX или XXXXX-XXXX). Эти инструменты не были разработаны для европейских форматов идентификаторов — и европейские форматы не являются незначительными вариациями американских форматов. Они структурно различны, культурно различны и юридически определены в рамках национального законодательства, не имеющего аналогов в США.

Немецкая Steuer-ID иллюстрирует структурное различие. 11-значный номер использует специфический алгоритм контрольной суммы — первая цифра не может быть 0, ни одна цифра не может появляться более трех раз подряд, а математическая формула, учитывающая позиции цифр, производит окончательную контрольную цифру. Алгоритм проверки опубликован Федеральным центральным управлением по налогам. Регулярное выражение для SSN в США не совпадет с Steuer-ID. Логика проверки контрольной суммы для SSN не будет действовать для Steuer-ID.

Французский NIR (Numéro de Sécurité Sociale) состоит из 15 цифр. Структура имеет семантическое значение: позиция 1 кодирует пол (1 = мужской, 2 = женский), позиции 2–3 кодируют последние две цифры года рождения, позиции 4–5 кодируют месяц рождения, позиции 6–7 кодируют департамент рождения, позиции 8–10 кодируют коммуну, позиции 11–13 кодируют порядок внутри коммуны, а позиции 14–15 являются контрольным ключом, полученным путем деления 13-значного числа на 97. NIR не может быть обнаружен с помощью любого регулярного выражения для идентификаторов формата США. Он требует реализации, специфичной для страны.

Пробел в соблюдении норм на уровне всего ЕС

Отчет IBM о стоимости утечки данных в 2025 году показал, что $10.22 миллиона — это средняя стоимость утечки данных в сфере здравоохранения — самая высокая среди всех секторов. Высокая стоимость утечек в секторе здравоохранения отражает как объем чувствительных данных, так и сложность требований по соблюдению норм. Когда утечки связаны с недостаточной деидентификацией общих исследовательских данных — как это происходит в 50% случаев утечек в сфере здравоохранения — сочетание недостаточного обнаружения идентификаторов ЕС и общих исследовательских данных создает системный риск.

Панъевропейский поставщик программного обеспечения для HR, обрабатывающий документы по приему на работу для клиентов в 18 странах ЕС с помощью инструмента PII, созданного в США, не обнаруживает 14 из 18 национальных идентификаторов стран. Этот разрыв является системным: каждый документ, обработанный этим инструментом, который содержит Steuer-ID, NIR, Personnummer, Fodselsnummer или другой идентификатор, специфичный для ЕС, оставляет этот идентификатор открытым.

Требования к полному покрытию ЕС

Минимальное покрытие ЕС для соблюдения GDPR требует:

DACH (Германия, Австрия, Швейцария): немецкая Steuer-ID и Reisepass; австрийский Sozialversicherungsnummer; швейцарский AHV-Nr (13-значный с контрольной цифрой)

Франция: NIR (15-значный номер социального страхования), Carte Vitale, SIRET (14-значный), SIREN (9-значный)

Великобритания (аналог GDPR после Brexit): NHS Number (10-значный), номер национального страхования (AA-NN-NN-NN-A формат), UTR (10-значный)

Скандинавия: шведский Personnummer (YYMMDD-XXXX), норвежский Fodselsnummer (11-значный), финский Henkilotunnus (DDMMYY-XXXX), датский CPR (DDMMYY-XXXX)

Южный ЕС: испанский DNI/NIE, итальянский Codice Fiscale (16-символьный алфавитно-цифровой), польский PESEL (11-значный), чешский Rodne Cislo

Организации, которые заменяют инструменты, созданные в США, на инструменты с полным покрытием ЕС, обычно обнаруживают, что их предыдущая деидентификация достигала 30–40% покрытия идентификаторов ЕС — оставляя большинство национальных идентификаторов Европы в их "деидентифицированных" наборах данных.

Источники:

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.