French Commission Nationale de l'Informatique et des Libertés (CNIL) є найбільш технічно вимогливим органом захисту даних в ЄС. Тоді як інші DPA зосереджуються переважно на процедурній відповідності, CNIL публікує детальні технічні вказівки — «recommandations» — що встановлюють конкретні алгоритмічні стандарти для анонімізації, псевдонімізації та управління даними AI. 63% офіційних повідомлень CNIL у 2024 році посилалися на неадекватну анонімізацію в системах AI.
Технічний вплив CNIL за межами Франції
Технічні вказівки CNIL регулярно цитуються іншими DPA ЄС:
Guide pratique de l'anonymisation (2023): Практичний посібник CNIL з анонімізації охоплює k-анонімність, l-різноманітність, диференційну приватність та їх практичне застосування до французьких наборів даних. 12+ DPA ЄС посилаються на цей посібник у власних вказівках з правозастосування.
Вказівки щодо систем AI (2024): Вказівки CNIL з управління AI охоплюють 6 обов'язкових категорій анонімізації для навчальних даних AI.
NIR: найчутливіший ідентифікатор Франції
Numéro d'Inscription au Répertoire (NIR) — також звана numéro de sécurité sociale — це 15-значний французький номер соціального страхування у форматі:
S AAMMDDCCC OOO K
Де:
- S = 1 цифра: стать (1=чоловіча, 2=жіноча)
- AA = 2 цифри: рік народження
- MM = 2 цифри: місяць народження
- DD = 2 цифри: département народження
- CCC = 3 цифри: код муніципалітету в département
- OOO = 3 цифри: порядковий номер народження
- K = 2 цифри: контрольний ключ (97 - (NIR mod 97))
NIR кодує стать, дату народження, місце народження та порядок народження — що робить його одним із найбільш дескриптивних ідентифікаторів в ЄС.
Проблема виявлення NIR: Формат NIR (S AAMMDD CCC OOO K із пробілами) і без форматування (SAAMMDDCCCOOOK) — у різних форматах. 78% загальних інструментів пропускають NIR без перевірки контрольної суми.
Рекомендації CNIL: технічні стандарти для PII-обробки
Рекомендація анонімізації CNIL 2023 року встановлює 6 технічних категорій:
- Приховування ідентифікаторів (masquage): замінити прямі ідентифікатори маркерами
- Агрегація: узагальнити категоріальні дані до широких груп
- Додавання шуму: додати статистичний шум до числових полів
- Перетасовка (shuffling): переставити значення атрибутів між записами
- Диференційна приватність: математично обмежений витік
- Синтетичні дані: повністю синтетична заміна чутливих полів
Джерела: