Tagasi BlogisseGDPR ja Vastavus

CNIL Prantsusmaa: GDPR vastavus Prantsusmaa...

CNIL töötles 16 433 kaebust 2023 ja trahvis €150M+ alates 2019. Selle AI juhendus on kohustuslik dokumenteeritud anonüümistamine koolitus andmete jaoks.

April 21, 20267 min lugemist
CNIL FranceFrench GDPRAI anonymizationFrench data protectionprivacy by design

CNIL positsioon kui EL kuigi tehnikas nõudlik DPA

Prantsusmaa Commission Nationale de l'Informatique et des Libertés (CNIL) avaldab EL-i kõige detailsem ja tehnikas spetsiifiline juhendus andmete kaitsel. Kus enamik EL DPA-d avaldavad üldine juhendus, CNIL avaldab "recommandations" - detailsed tehniliselt spetsifikatsioonid, mis on CNIL-i tõlgendus sellest, mida GDPR vastavus nõuab.

See tehnikas range hoiak on kehtestanud CNIL kõik EL jätkusuutlikkuse privaatsuse insenerinnist. Muud EL DPA-d sageli viitavad CNIL-i tehniliselt publikatsioonidel, eriti selle 2023 "Guide pratique de l'anonymisation" (praktiline juhendus anonüümistamine) ja 2024 generatiivne AI juhendus.

CNIL töötles 16 433 kaebust 2023 - 43% kasv 2022-st - ja on andnud ligikaudu €150M GDPR trahvidesse alates 2018. Kasv kaebuse maht peegeldab nii tõstvalt avaliku teadlikkuse ja CNIL väljaminek võttes andmete subjektid kasutada nende õigusi.

CNIL AI koolitus andmete anonüümistamise nõudmised

CNIL 2024 generatiivne AI juhendus ("Systèmes d'IA générative") kehtestab siduvat nõudmised organisatsioonide jaoks, kes koolitavad AI mudeleid Prantsusmaa isikuandmete alusel või juurutavad AI süsteemid, mis töötlevad Prantsusmaa kasutajate andmeid.

Juhendus tuvastab kuus kohustuslik anonüümistamise kategooriate AI koolitusandmete jaoks:

  1. Identifiants directs (otsene identifikaatorid): Nimed, aadressid, identifitseerimise numbrid - peavad olema eemaldatud või asendatud enne AI koolitusõpet
  2. Identifiants quasi-directs (kvaasi-identifikaatorid): kombinatsioonid omaduste, mis võimaldab uuesti identifitseerimise - peab olema hinnatud k-anonüümsuse jaoks
  3. Données sensibles (eriline kategooria): Tervishoiu, bioloogiline, poliitilised, usuline andmete - peab olema eraldatud täiendavate anonüümistamise meetmete alusel
  4. Données comportementales (käitumuseline andmete): Lehitsemise ajalugu, interaktsiooni mustrid - peab olema agregeeritud või pseudonüümsed
  5. Données inférées (järeldatud andmete): AI-järeldatud omadused käitumuseli andmete alusel - nõuetud kasutuse piirangud kontrolleid
  6. Données relatives aux mineurs (laste andmete): Mis tahes andmete potentsiaalselt seotud isikud alla 15 - kohustuslik vanusehaiguse ja parandatud anonüümistamise

Organisatsioonide jaoks, kasutades LLM, mis on koolitatud veebi-puhutud andmete alusel (tavaline lähenemist), CNIL juhendus nõuab dokumentatsiooni, et koolitusandmed oli hinnatud nende kuue kategooriate vastu ja sobiv anonüümistamise rakendatud.

"Guide Pratique de l'Anonymisation" nõudmised

CNIL 2023 anonüümistamise juhendus on EL-i kõige detailsem ametlik juhendus sellest, mida tehnikas moodustab anonüümistamise. Peamised nõudmised:

Anonüümistamise tehniliselt CNIL-i poolt heakskiidetud:

  • k-anonüümsus: tagades iga kirje on eristamatu vähemalt k-1 teiste kirjete alusel
  • l-mitmekesisus: nõudsed mitmekesisus tundligates omadustes siseselt ekvivalentsus klassidel
  • Diferentsiaalse privaatsus: lisamine kalibreeritult müra statistiliselt väljundite
  • Pseudonümiseerimise (selgelt märgitud pole anonüümistamise kuid riskihindamise mõõt)

Dokumentatsiooni nõudmised: CNIL-i juhendus nõuab, et organisatsioonid hoidvat "fiche d'anonymisation" (anonüümistamise kirje) igal töötlemise tegevus, kasutades anonüümistamise, dokumenteerimine: anonüümistamise tehnika rakendatud, parameetrid kasutatud (k väärtus k-anonüümsuse jaoks, epsilon väärtus diferentsiaalse privaatsuse jaoks), hindamise jäägi uuesti identifitseerimise riskist, ja valideerimise metoodoloogia.

Uuesti identifitseerimise riskist hindamine: CNIL nõuab organisatsioonide viia uuesti identifitseerimise riskist hindamine enne nõudmist andmete on anonüümsed. Hindamine peab arvestavat: "motiveeritud sissetungija" test (võiks motiveeritud isik uuesti identifitseerimise andmete?), saadaolevad abikomplektid andmete, ja spetsiifiline kontekst andmete.

CNIL jõustamise: AI trahvi muster

CNIL jõustamise toimingud vastu AI süsteemid kehtestada presedent sellest, mida "piisav tehniline meetmed" tähendab AI kontekstis:

Clearview AI (€20M trahvi, 2022): Töötlemise bioloogiline andmete Prantsusmaa isikutest nõudmata õiguse alust, kogutud avaliku veebi allikatest. Kehtestatud, et massbulk veebi-kraapimise isikuandmete jaoks AI koolitusõppest nõuab selgesõnaline õiguse alust.

TikTok uurimine (2024-2025 käiv): Fokuseeritud algoritmiliselt soovitus süsteemid, mis võivad järeldada tundligates kategooriate käitumuseli andmete alusel. CNIL-i uurimine metoodoloogia on muutunud EL standard AI süsteemi auditid.

Generatiivne AI ülevaade (2024-2025): CNIL viis läbi süstemaatiline ülevaatused LLM myyjate toimimine Prantsusmaa, fokusseeritakse koolitus andmete päritolu ja anonüümistamise. Myyjad ilma dokumenteeritud anonüümistamise menetluste jaoks Prantsusmaa kasutajate andmeid olid nõutakse rakendama kontrolleid.

Muster: CNIL jõustamise fokuseeritakse tehnikas puudulikkus - puudumine dokumenteeritud tehniliselt kontrollide - pigem kui puhtalt protseduuriliselt rikkumised.

Rakendamine CNIL-i nõutav anonüümistamise dokumentatsioon

Prantsusmaa organisatsioonide jaoks või organisatsioonide serveeritakse Prantsusmaa kasutajate, CNIL-i nõutav anonüümistamise positsioon nõuab:

1. Fiche d'anonymisation (anonüümistamise kirje) iga töötlemise tegevus:

  • Töötlemise eesmärk ja andmete kategooriad
  • Anonüümistamise tehnika rakendatud (koos parameetriga)
  • Uuesti identifitseerimise riskist hindamise tulemus
  • Valideerimise meetod (testid, väline ülevaade)
  • Vastutav isik ja ülevaate kuupäev

2. Eelnev töötlemise AI süsteemide jaoks:

  • Dokumendi PII tuvastamise tööriist ja konfiguratsioon kasutatud
  • Salvestamine olemid tüübid tuvastatud ja eemaldatud/pseudonüümsed
  • Säilitada töötlemise logid CNIL auditi nõudmised

3. Prantsusmaa keelele PII kattuvus:

  • Kontrolli tuvastamise kattuvus Prantsusmaa spetsiifilistele identifikaatoridele (NIR, carte vitale, CNI)
  • Valideerimise Prantsusmaa NER mudeli tulemuslikkuse Prantsusmaa isiklike nimede alusel
  • Dokumendi kattuvuse lüngad ja kompenseerivad kontrolleid

4. Koolitusandmete päritolu:

  • AI süsteemide jaoks koolitatud veebi-puhutud andmete alusel: dokumendi allikas andmestik anonüümistamise hindamise
  • AI süsteemide jaoks koolitatud kasutaja andmete alusel: dokumendi kasutaja andmete anonüümistamise protsess

CNIL inspektsiooni nõudmised AI süsteemide jaoks tavaliselt kaasava nõudmised nende dokumentide jaoks. Organisatsioonid koos pre-eksisteerivat dokumentatsiooni rahuldavad inspektsiooni nõudmised märkimisväärt kiirem kui need tegemisel hindamiste jõud.

Allikad:

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.