By · Last updated 2026-06-05

Atpakaļ uz BloguGDPR un Atbilstība

CNIL Francija: GDPR tehniskā atbilstība

CNIL 2023. gadā apstrādāja 16 433 sūdzības un kopš 2019. gada ir piemērojusi naudas sodus vairāk nekā 150 miljonu EUR apmērā. Tās AI norādījumi prasa dokumentētu anonimizāciju apmācības datiem.

June 5, 20267 min lasīšanai
CNIL FranceFrench GDPRAI anonymizationFrench data protectionprivacy by design

CNIL Francija: GDPR tehniskā atbilstība

Francijas stingrākā privātuma regulatora iestāde

Francijas datu iestāde ir CNIL. Tā nosaka ES precīzākos privātuma noteikumus. Lielākā daļa ES regulatoru raksta plašus norādījumus. CNIL iet tālāk. Tā publicē precīzas tehniskas specifikācijas, ko sauc par recommandations. Tās nosaka, kā izskatās reāla GDPR atbilstība.

Citas ES regulatoru iestādes bieži kopē CNIL darbu. Galvenie teksti ietver 2023. gada Guide pratique de l'anonymisation un 2024. gada AI norādījumus.

Skaitļi parāda, ka aģentūra ir aktīva. Tā 2023. gadā izskatīja 16 433 sūdzības. Tas ir par 43% vairāk nekā 2022. gadā. Tā ir piemērojusi apmēram 150 miljonus eiro GDPR sodų kopš izpildes sākuma.

AI apmācība: seši ierakstu tipi, kas jāiztīra

CNIL 2024. gada AI norādījumi plaši piemērojami. Tie attiecas uz jebkuru grupu, kas apmāca AI ar franču personas ierakstiem. Tie attiecas arī uz tiem, kas apkalpo franču lietotājus ar AI rīkiem.

Aģentūra uzskaita sešus ierakstu tipus, kas jāiztīra pirms AI apmācības:

  1. Identifiants directs (tiešie ID): Vārdi, adreses, ID numuri. Noņemiet vai aizstājiet tos pirms apmācības.
  2. Identifiants quasi-directs (kvazi-ID): Iezīmju kopas, kas ļauj atkārtotu identifikāciju. Piemērojiet k-anonimitātes pārbaudes.
  3. Donnees sensibles (īpašie tipi): Veselības, biometriskās, politiskās un ticības ieraksti. Nošķiriet ar papildu kontrolēm.
  4. Donnees comportementales (izmantošanas ieraksti): Pārlūkošanas vēsture un izmantošanas modeļi. Apkopojiet vai maskējiet tos.
  5. Donnees inferees (secinātās iezīmes): AI atvasinātie signāli no izmantošanas. Piemērojiet mērķa ierobežojumus.
  6. Donnees relatives aux mineurs (bērnu ieraksti): Jebkuri ieraksti, kas saistīti ar personām, kas jaunākas par 15 gadiem. Veiciet vecuma pārbaudes un izmantojiet stingru iztīrīšanu.

Izmantojat LLM, kas apmācīti ar sagrabētu saturu? Jums nepieciešami rakstiski pierādījumi. Parādiet, ka jūsu apmācības ieraksti tika pārskatīti un iztīrīti. Skatiet mūsu GDPR atbilstības rokasgrāmatu par tvēruma detaļām.

Anonimizācijas rokasgrāmata: pamatnoteikumi

  1. gada rokasgrāmata ir ES visprecīzākais teksts par šo tēmu. Tā nosaka standartu tam, kas uzskatāms par patiesi anonīmu.

Apstiprinātās metodes:

  • k-anonimitāte — katrs ieraksts izskatās kā vismaz k-1 citi
  • l-daudzveidība — sensitīvās iezīmes mainās katrā grupā
  • Diferenciālā privātuma — troksnis pievienots izvades statistikām
  • Pseidonimizācija — riska samazināšanas solis, ne patiesā anonimizācija

Nepieciešamie ieraksti:

Katrai darbībai, kas izmanto iztīrīšanu, CNIL sagaida fiche d'anonymisation (anonimizācijas ierakstu). Tam jāietver:

  • Izmantotā metode un tās galvenie iestatījumi (k vērtība, epsilon vērtība)
  • Atkārtotas identifikācijas riska pārbaudes rezultāts
  • Validācijas metode (testēšana vai ārējā pārskatīšana)
  • Atbildīgā persona un pārskatīšanas datums

Atkārtotas identifikācijas riska pārbaude:

Pirms ierakstu atzīšanas par anonīmiem veiciet formālu pārbaudi. Jautājiet: vai motivēta persona varētu tos atkārtoti identificēt? Apskatiet, kādi palīgdatu kopumi pastāv. Apsveriet pilno kontekstu.

Franču PII: ko jūsu rīkiem jāatrod

Franču noteikumi prasa franču valodas PII pārklājumu. Jūsu rīkiem jānosaka Francijai specifiskie ID tipi.

Galvenie ID, kas jāaptver:

  • NIR: 15 cipari (13 pamata + 2 ciparu atslēga). Šis ir Francijai Sociālās nodrošināšanas numurs.
  • Carte vitale numurs: Veselības apdrošināšanas kartes ID.
  • SIRET/SIREN: Uzņēmuma ID, kas atrodami personas failos.
  • Numero d'ordre professionnel: Reģistra numuri ārstiem, juristiem un grāmatvežiem.
  • CNI (Carte nationale d'identite): Franču nacionālās ID kartes numurs.

Franču NER modeļiem ir jārisina franču vārdu modeļi. Tie ietver saliktos vārdus (Jean-Pierre), daļiņas (de, du, des) un uzvārdus ar defisi. Skatiet mūsu daudzvalodu PII noteikšanas rokasgrāmatu par to, kā aptvert visas lokalizācijas.

Izpilde: par ko tiek sodīts

Aģentūras sodi seko skaidram modelim. Tie mērķē uz trūkstošajām tehniskajām kontrolēm. Slikts process vien reti ir galvenais jautājums.

Clearview AI — 20 milj. EUR sods (2022): Uzņēmums apstrādāja franču cilvēku biometriskos ierakstus bez juridiskas bāzes. Ieraksti tika sagrabēti no publiskajiem tīmekļa avotiem. Gadījums apstiprināja: masveida tīmekļa sagrabēšanai AI apmācībai nepieciešams skaidrs juridiskais pamats.

TikTok — izmeklēšana uzsākta 2024. gadā: Koncentrējas uz sistēmām, kas var secināt sensitīvus tipus no izmantošanas signāliem. Šī metode tagad ir ES atsauce AI auditiem.

Ģeneratīvā AI pārskatīšana (2024.–2025.): Aģentūra pārskatīja LLM pārdevējus Francijā. Tā koncentrējās uz apmācības satura izcelsmi. Pārdevēji bez atbilstošajiem ierakstiem bija jāpievieno kontroles.

Četri soļi CNIL atbilstībai

Apstrādājat franču personas ierakstus? Jums jābūt četrām lietām vietā.

1. Anonimizācijas ieraksts katrai darbībai

Katrai darbībai, kas izmanto iztīrīšanu, nepieciešams savs ieraksts. Norādiet metodi, tās iestatījumus, riska rezultātu un pārskatīšanas datumu.

2. Priekšapstrādes protokoli AI

Protokolējiet, kuru PII noteikšanas rīku izmantojāt. Norādiet, kurus entītes tipus tas atrada. Ierakstiet, kas tika noņemts vai maskēts. Sagatavojiet šos protokolus auditiem.

3. Franču valodas PII pārklājums

Pārbaudiet, vai jūsu rīks atrod NIR, carte vitale un CNI numurus. Testējiet savu franču NER modeli ar reāliem franču vārdiem. Atzīmējiet visas plaisas. Ierakstiet kontroles, ko ieviešat to novēršanai.

4. Apmācības satura izcelsmes ieraksti

Sagrabētam saturam: dokumentējiet avota iztīrīšanas pārbaudi. Lietotāju ierakstiem: dokumentējiet lietotāja iztīrīšanas procesu. Mūsu drošības atbilstības pārskats parāda, kā tas iekļaujas plašākā drošības pasākumu kopumā.

Grupu ar labiem ierakstiem auditi norisinās ātri. Veidojiet savu dokumentāciju tagad. Negaidiet pārbaudi, lai sāktu.

Avoti

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.