anonym.legal
Takaisin BlogiinGDPR & Vaatimustenmukaisuus

CNIL Ranska: GDPR-yhteensopivuus Ranskan tietosuojaviranomaisen alaisuudessa — Mitä teknisten tiimien on tiedettävä

CNIL käsitteli 16 433 valitusta vuonna 2023 ja määräsi yli 150 miljoonan euron sakot vuodesta 2019. Sen tekoälyohjeet edellyttävät dokumentoitua anonymisointia koulutusdatassa. Tässä on, mitä teknisten tiimien on toteutettava.

March 7, 20267 min lukuaika
CNIL FranceFrench GDPRAI anonymizationFrench data protectionprivacy by design

CNIL:n asema EU:n teknisesti vaativimpana tietosuojaviranomaisena

Ranskan Commission Nationale de l'Informatique et des Libertés (CNIL) julkaisee EU:n yksityiskohtaisimmat ja teknisesti spesifisimmät ohjeet tietosuojasta. Siinä missä useimmat EU:n tietosuojaviranomaiset antavat yleisiä ohjeita, CNIL julkaisee "recommandations" — yksityiskohtaisia teknisiä spesifikaatioita, jotka muodostavat CNIL:n tulkinnan siitä, mitä GDPR-yhteensopivuus vaatii.

Tämä tekninen tarkkuus on vakiinnuttanut CNIL:n EU:n vertailukohtana yksityisyysinsinöörityössä. Muut EU:n tietosuojaviranomaiset viittaavat usein CNIL:n teknisiin julkaisuisiin, erityisesti sen vuoden 2023 "Guide pratique de l'anonymisation" (käytännön opas anonymisointiin) ja vuoden 2024 generatiivisen tekoälyn ohjeisiin.

CNIL käsitteli 16 433 valitusta vuonna 2023 — 43 % lisää verrattuna vuoteen 2022 — ja on määrännyt noin 150 miljoonaa euroa GDPR-sakkoja vuodesta 2018. Valitusten määrän kasvu heijastaa sekä lisääntynyttä julkista tietoisuutta että CNIL:n tiedotuskampanjoita, jotka kannustavat rekisteröityjä käyttämään oikeuksiaan.

CNIL:n tekoälyn koulutusdatan anonymisointivaatimukset

CNIL:n vuoden 2024 generatiivisen tekoälyn ohjeet ("Systèmes d'IA générative") asettavat sitovia vaatimuksia organisaatioille, jotka kouluttavat tekoälymalleja ranskalaisilla henkilötiedoilla tai käyttävät tekoälyjärjestelmiä, jotka käsittelevät ranskalaisten käyttäjien tietoja.

Ohjeet määrittelevät kuusi pakollista anonymisointikategoriaa tekoälyn koulutusdatassa:

  1. Identifiants directs (suorat tunnisteet): Nimet, osoitteet, henkilötunnukset — on poistettava tai korvattava ennen tekoälyn koulutusta
  2. Identifiants quasi-directs (kvasi-identifikaattorit): Ominaisuuksien yhdistelmät, jotka mahdollistavat uudelleen tunnistamisen — on arvioitava k-anonymiteetti
  3. Données sensibles (erityiset kategoriat): Terveys-, biometriset, poliittiset, uskonnolliset tiedot — on eristettävä lisäanonymisointitoimenpiteillä
  4. Données comportementales (käyttäytymistiedot): Selaushistoria, vuorovaikutusmallit — on aggregoitava tai pseudonymisoitava
  5. Données inférées (päättelytiedot): Tekoälyn päättelytiedot käyttäytymistiedoista — alttiina käyttötarkoituksen rajoituskontrolleille
  6. Données relatives aux mineurs (lasten tiedot): Kaikki tiedot, jotka mahdollisesti liittyvät alle 15-vuotiaisiin — pakollinen ikätodennus ja tehostettu anonymisointi

Organisaatioilta, jotka käyttävät LLM:ää, joka on koulutettu verkkosivuilta kerätyillä tiedoilla (yleinen lähestymistapa), CNIL:n ohjeet vaativat dokumentaatiota siitä, että koulutusdata on arvioitu näiden kuuden kategorian mukaan ja asianmukainen anonymisointi on toteutettu.

"Guide Pratique de l'Anonymisation" -vaatimukset

CNIL:n vuoden 2023 anonymisointiohje on EU:n yksityiskohtaisin virallinen ohje siitä, mitä teknisesti tarkoittaa anonymisointi. Keskeiset vaatimukset:

CNIL:n hyväksymät anonymisointitekniikat:

  • k-anonymiteetti: varmistaa, että jokainen tietue on erottamaton vähintään k-1 muusta tietueesta
  • l-monimuotoisuus: vaatii monimuotoisuutta herkissä attribuuteissa ekvivalenssiluokissa
  • Differentiaalinen yksityisyys: lisää kalibroitua kohinaa tilastollisiin tuloksiin
  • Pseudonymisointi (erityisesti huomautettu, että se ei ole anonymisointi, vaan riskin vähentämistoimenpide)

Dokumentaatio vaatimukset: CNIL:n ohjeet edellyttävät, että organisaatiot ylläpitävät "fiche d'anonymisation" (anonymisointitietue) jokaiselle käsittelytoiminnalle, jossa käytetään anonymisointia, dokumentoiden: käytetty anonymisointitekniikka, käytetyt parametrit (k-arvo k-anonymiteetille, epsilon-arvo differentiaaliselle yksityisyydelle), jäljelle jäävän uudelleen tunnistamisriskin arviointi ja validointimenetelmä.

Uudelleen tunnistamisriskin arviointi: CNIL vaatii organisaatioita suorittamaan uudelleen tunnistamisriskin arvioinnin ennen kuin väitetään, että tiedot on anonymisoitu. Arvioinnissa on otettava huomioon: "motivated intruder" -testi (voiko motivoitunut henkilö uudelleen tunnistaa tiedot?), saatavilla olevat apu-datasetit ja tietojen erityinen konteksti.

CNIL:n ranskankielisten PII-tunnistusnäkökohdat

Ranskankielisiä tietoja käsitteleviltä organisaatioilta CNIL:n ohjeet edellyttävät, että PII-tunnistustyökalujen on katettava ranskankieliset PII:t. Ranskakohtaiset entiteettityypit, jotka on tunnistettava:

  • Numéro de Sécurité Sociale (NIR): 13-numeroisen Ranskan sosiaaliturvatunnus, jossa on erityinen muotovalidointi
  • Carte vitale number: Terveydenhuoltokortin tunniste, jota käytetään Ranskan terveydenhuollon hallinnossa
  • Numéro d'identification au répertoire (NIR): Väestörekisterin tunniste
  • SIRET/SIREN: Liiketoimintatunnisteet, jotka voivat esiintyä henkilökohtaisissa liiketoimintayhteyksissä
  • Numéro d'ordre professionnel: Ammattirekisterin numerot (lääkärit, asianajajat, kirjanpitäjät)
  • Carte nationale d'identité (CNI): Ranskan kansallinen henkilökorttinumero

Ranskan NER-mallien, jotka tunnistavat henkilöiden nimiä, on myös käsiteltävä ranskankielisiä nimeämiskäytäntöjä: yhdysnimet (Jean-Pierre), yhdysmerkillä varustetut nimet, partikkeleita (de, du, des) ja ranskakohtaisia nimeämismalleja.

CNIL:n valvonta: Tekoälysakkojen malli

CNIL:n valvontatoimet tekoälyjärjestelmiä vastaan luovat ennakkotapauksen sille, mitä "riittävät tekniset toimenpiteet" tarkoittaa tekoälykontekstissa:

Clearview AI (20 miljoonan euron sakko, 2022): Ranskalaisten henkilöiden biometristen tietojen käsittely ilman laillista perustetta, kerätty julkisista verkkolähteistä. Vakiinnutti, että henkilökohtaisten tietojen massakeruu tekoälyn koulutusta varten vaatii nimenomaisen laillisen perusteen.

TikTok-tutkimus (2024-2025 käynnissä): Keskittyi algoritmisiin suositusjärjestelmiin, jotka voivat päätellä herkkiä kategorioita käyttäytymistiedoista. CNIL:n tutkimusmenetelmistä on tullut EU:n standardi tekoälyjärjestelmien tarkastuksille.

Generatiivisen tekoälyn tarkastus (2024-2025): CNIL suoritti systemaattisia tarkastuksia Ranskassa toimivista LLM-toimittajista, keskittyen koulutusdatan alkuperään ja anonymisointiin. Toimittajilta, joilla ei ollut dokumentoituja anonymisointimenettelyjä ranskalaisten käyttäjien tiedoille, vaadittiin hallintotoimenpiteiden toteuttamista.

Malli: CNIL:n valvonta keskittyy tekniseen riittämättömyyteen — dokumentoitujen teknisten kontrollien puutteeseen — eikä pelkästään menettelyllisiin rikkomuksiin.

CNIL-yhteensopivan anonymisointidokumentaation toteuttaminen

Ranskalaisilta organisaatioilta tai organisaatioilta, jotka palvelevat ranskalaisia käyttäjiä, CNIL-yhteensopiva anonymisointiasema vaatii:

1. Fiche d'anonymisation (anonymisointitietue) jokaiselle käsittelytoiminnalle:

  • Käsittelyn tarkoitus ja tietoluokat
  • Käytetty anonymisointitekniikka (parametreineen)
  • Uudelleen tunnistamisriskin arvioinnin tulos
  • Validointimenetelmä (testaus, ulkoinen tarkastus)
  • Vastuutaho ja tarkastuspäivämäärä

2. Esikäsittely tekoälyjärjestelmille:

  • Dokumentoi käytetty PII-tunnistustyökalu ja konfiguraatio
  • Tallenna tunnistetut ja poistettavat/pseudonymisoidut entiteettityypit
  • Ylläpidä käsittelylokit CNIL:n tarkastuspyyntöjä varten

3. Ranskankielinen PII-kattavuus:

  • Varmista tunnistuskattavuus ranskakohtaisille tunnisteille (NIR, carte vitale, CNI)
  • Vahvista ranskalaisen NER-mallin suorituskyky ranskankielisissä henkilöiden nimissä
  • Dokumentoi kattavuusaukot ja kompensoivat kontrollit

4. Koulutusdatan alkuperä:

  • Tekoälyjärjestelmille, jotka on koulutettu verkkosivuilta kerätyillä tiedoilla: dokumentoi lähdedatan anonymisointiarviointi
  • Tekoälyjärjestelmille, jotka on koulutettu käyttäjätiedoilla: dokumentoi käyttäjätietojen anonymisointiprosessi

CNIL:n tarkastuspyynnöt tekoälyjärjestelmille sisältävät säännöllisesti pyyntöjä näiden asiakirjojen toimittamiseksi. Organisaatiot, joilla on ennestään dokumentaatio, täyttävät tarkastusvaatimukset merkittävästi nopeammin kuin ne, jotka tekevät arviointeja reaktiivisesti.

Lähteet:

Valmiina suojaamaan tietojasi?

Aloita PII-anonymisointi yli 285 entiteettityypillä 48 kielellä.