anonym.legal

By · Last updated 2026-06-05

Назад до блогуGDPR та відповідність

CNIL Франція: технічна відповідність GDPR

CNIL обробила 16 433 скарги у 2023 році та наклала штрафи на суму понад 150 млн євро з 2019 року. Її настанови щодо ШІ зобов'язують до задокументованої анонімізації навчальних даних.

June 5, 20267 хв читання
CNIL FranceFrench GDPRAI anonymizationFrench data protectionprivacy by design

CNIL Франція: технічна відповідність GDPR

Найсуворіший регулятор конфіденційності Франції

Французький орган захисту даних — CNIL. Він встановлює найточніші правила конфіденційності в ЄС. Більшість регуляторів ЄС видають загальні настанови. CNIL іде далі. Він публікує точні технічні специфікації, що називаються recommandations. Вони визначають, як виглядає реальна відповідність GDPR.

Інші регулятори ЄС часто запозичують роботу CNIL. До ключових текстів належать Guide pratique de l'anonymisation 2023 року та настанови щодо ШІ 2024 року.

Цифри свідчать про активність агентства. Воно обробило 16 433 скарги у 2023 році. Це на 43% більше, ніж у 2022 році. З початку правозастосування воно наклало штрафи на загальну суму близько 150 мільйонів євро за GDPR.

Навчання ШІ: шість типів записів для очищення

Настанови CNIL щодо ШІ 2024 року мають широке застосування. Вони поширюються на всіх, хто навчає ШІ на французьких персональних записах. А також на тих, хто обслуговує французьких користувачів інструментами ШІ.

Агентство перелічує шість типів записів, які потребують очищення до навчання ШІ:

  1. Identifiants directs (прямі ідентифікатори): імена, адреси, ідентифікаційні номери. Видаліть або замініть їх до навчання.
  2. Identifiants quasi-directs (квазі-ідентифікатори): сукупності ознак, що дозволяють повторну ідентифікацію. Застосуйте перевірки k-анонімності.
  3. Données sensibles (спеціальні категорії): медичні, біометричні, політичні та релігійні записи. Ізолюйте з додатковими засобами контролю.
  4. Données comportementales (записи про поведінку): історія перегляду та шаблони використання. Агрегуйте або маскуйте їх.
  5. Données inférées (виведені ознаки): сигнали, отримані ШІ з даних використання. Застосуйте обмеження мети.
  6. Données relatives aux mineurs (записи про дітей): будь-які записи, пов'язані з особами молодше 15 років. Проводьте перевірку віку та застосовуйте суворе очищення.

Використовуєте LLM, навчені на зібраному контенті? Вам потрібні письмові докази. Покажіть, що ваші навчальні записи були перевірені й очищені. Читайте наш посібник з відповідності GDPR для отримання детальної інформації.

Посібник з анонімізації: основні правила

Посібник 2023 року є найдетальнішим текстом ЄС на цю тему. Він встановлює планку для того, що вважається справді анонімним.

Затверджені методи:

  • k-анонімність — кожен запис виглядає принаймні як k-1 інших
  • l-різноманіття — чутливі ознаки варіюються всередині кожної групи
  • Диференційна конфіденційність — шум додається до вихідної статистики
  • Псевдонімізація — крок зниження ризику, а не справжня анонімізація

Обов'язкові записи:

Для кожної діяльності, що передбачає очищення, CNIL очікує fiche d'anonymisation (картку анонімізації). Вона має містити:

  • Використаний метод та його ключові налаштування (значення k, значення epsilon)
  • Результат перевірки ризику повторної ідентифікації
  • Метод валідації (тестування або зовнішній перегляд)
  • Відповідальну особу та дату перегляду

Перевірка ризику повторної ідентифікації:

Перед позначенням записів як анонімних проведіть формальну перевірку. Запитайте: чи може мотивована особа повторно ідентифікувати ці дані? Розгляньте наявні допоміжні набори даних. Врахуйте повний контекст.

Французькі ПДн: що ваші інструменти мають виявляти

Французькі правила вимагають охоплення ПДн французькою мовою. Ваші інструменти повинні виявляти ідентифікатори, специфічні для Франції.

Ключові ідентифікатори для охоплення:

  • NIR: 15 цифр (13 базових + 2-значний ключ). Це французький номер соціального страхування.
  • Номер carte vitale: ідентифікатор картки медичного страхування.
  • SIRET/SIREN: бізнес-ідентифікатори, що зустрічаються в особистих файлах.
  • Numéro d'ordre professionnel: реєстраційні номери для лікарів, юристів та бухгалтерів.
  • CNI (Carte nationale d'identité): номер французького національного посвідчення особи.

Французькі моделі NER мають обробляти французькі шаблони імен. Це включає складні імена (Jean-Pierre), частки (de, du, des) та подвійні прізвища. Читайте наш посібник з багатомовного виявлення ПДн про охоплення всіх локалей.

Правозастосування: за що накладають штрафи

Штрафи агентства слідують чіткій закономірності. Вони спрямовані проти відсутності технічних засобів контролю. Проблеми лише з процесами рідко є основним предметом.

Clearview AI — штраф 20 млн євро (2022): Компанія обробляла біометричні записи французьких громадян без правової підстави. Записи були зібрані з публічних веб-джерел. Ця справа підтвердила: масове збирання даних з інтернету для навчання ШІ потребує явної правової підстави.

TikTok — розслідування розпочато у 2024 році: Зосереджено на системах, що можуть виводити чутливі категорії із сигналів використання. Цей метод тепер є еталонним для аудитів ШІ в ЄС.

Перевірка генеративного ШІ (2024–2025): Агентство перевіряло постачальників LLM у Франції. Увага зосереджувалась на походженні навчального контенту. Постачальники без належних записів були змушені додати засоби контролю.

Чотири кроки до відповідності вимогам CNIL

Обробляєте французькі персональні записи? Вам потрібні чотири речі.

1. Картка анонімізації для кожного виду діяльності

Кожен вид діяльності, що передбачає очищення, потребує власної картки. Зазначте метод, його налаштування, результат перевірки ризику та дату перегляду.

2. Журнали попередньої обробки для ШІ

Записуйте, який інструмент виявлення ПДн ви використовували. Зазначте, які типи сутностей він знайшов. Фіксуйте, що було видалено або замасковано. Тримайте ці журнали готовими для аудитів.

3. Охоплення ПДн французькою мовою

Перевірте, що ваш інструмент знаходить номери NIR, carte vitale та CNI. Протестуйте свою французьку модель NER на реальних французьких іменах. Зафіксуйте будь-які прогалини. Задокументуйте засоби контролю, що ви запровадили для їх усунення.

4. Записи про походження навчального контенту

Для зібраного контенту: задокументуйте перевірку очищення джерела. Для записів користувачів: задокументуйте процес очищення записів користувачів. Наш огляд відповідності вимогам безпеки показує, як це вписується в ширший стек захисних заходів.

Організації з належними записами проходять аудити швидко. Підготуйте свою документацію зараз. Не чекайте перевірки.

Джерела

Готові захистити свої дані?

Почніть анонімізувати PII з 285+ типами сутностей на 48 мовах.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.