Tillbaka till BloggenGDPR & Efterlevnad

CNIL Frankrike: GDPR-efterlevnad under Frankrikes dataskyddsmyndighet — Vad tekniska team måste veta

CNIL hanterade 16 433 klagomål under 2023 och har böter på över 150 miljoner euro sedan 2019. Dess AI-riktlinjer kräver dokumenterad anonymisering för träningsdata. Här är vad tekniska team måste implementera.

March 7, 20267 min läsning
CNIL FranceFrench GDPRAI anonymizationFrench data protectionprivacy by design

CNIL:s position som EU:s mest tekniskt krävande DPA

Frankrikes Commission Nationale de l'Informatique et des Libertés (CNIL) publicerar EU:s mest detaljerade och tekniskt specifika riktlinjer för dataskydd. Medan de flesta EU DPA:er utfärdar allmänna riktlinjer publicerar CNIL "recommandations" — detaljerade tekniska specifikationer som utgör CNIL:s tolkning av vad GDPR-efterlevnad kräver.

Denna tekniska stränghet har etablerat CNIL som EU:s riktmärke för integritetsengineering. Andra EU DPA:er hänvisar ofta till CNIL:s tekniska publikationer, särskilt dess 2023 "Guide pratique de l'anonymisation" (praktisk guide till anonymisering) och 2024 riktlinjer för generativ AI.

CNIL hanterade 16 433 klagomål under 2023 — en ökning med 43 % från 2022 — och har utfärdat cirka 150 miljoner euro i GDPR-böter sedan 2018. Ökningen i klagomålsvolymen återspeglar både ökad offentlig medvetenhet och CNIL:s informationskampanjer som uppmuntrar registrerade att utöva sina rättigheter.

CNIL:s krav på anonymisering av AI-träningsdata

CNIL:s 2024 riktlinjer för generativ AI ("Systèmes d'IA générative") fastställer bindande krav för organisationer som tränar AI-modeller på franska personuppgifter eller distribuerar AI-system som behandlar franska användares data.

Riktlinjerna identifierar sex obligatoriska anonymiseringskategorier för AI-träningsdata:

  1. Identifiants directs (direkta identifierare): Namn, adresser, identifikationsnummer — måste tas bort eller ersättas före AI-träning
  2. Identifiants quasi-directs (kvasi-identifierare): Kombinationer av attribut som möjliggör återidentifiering — måste bedömas för k-anonymitet
  3. Données sensibles (särskilda kategorier): Hälsa, biometriska, politiska, religiösa data — måste separeras med ytterligare anonymiseringsåtgärder
  4. Données comportementales (beteendedata): Webbhistorik, interaktionsmönster — måste aggregeras eller pseudonymiseras
  5. Données inférées (infererade data): AI-infererade egenskaper från beteendedata — föremål för syftesbegränsningskontroller
  6. Données relatives aux mineurs (barns data): All data som potentiellt rör personer under 15 — obligatorisk åldersverifiering och förbättrad anonymisering

För organisationer som använder LLM:er som tränats på web-scraped data (en vanlig metod) kräver CNIL:s riktlinjer dokumentation som visar att träningsdata har bedömts mot dessa sex kategorier och lämplig anonymisering har tillämpats.

Krav i "Guide Pratique de l'Anonymisation"

CNIL:s 2023 anonymiseringsguide är EU:s mest detaljerade officiella riktlinje om vad som tekniskt utgör anonymisering. Nyckelkrav:

Anonymiseringstekniker som stöds av CNIL:

  • k-anonymitet: säkerställa att varje post är odistinguishable från minst k-1 andra poster
  • l-mångfald: kräva mångfald i känsliga attribut inom ekvivalensklasser
  • Differential privacy: lägga till kalibrerad brus till statistiska utdata
  • Pseudonymisering (uttryckligen noterat som inte anonymisering utan en riskreducerande åtgärd)

Dokumentationskrav: CNIL:s guide kräver att organisationer upprätthåller en "fiche d'anonymisation" (anonymiseringsregister) för varje behandlingsaktivitet som använder anonymisering, dokumentera: den tillämpade anonymiseringstekniken, de använda parametrarna (k-värde för k-anonymitet, epsilon-värde för differential privacy), bedömningen av kvarstående återidentifieringsrisk och valideringsmetodologin.

Bedömning av återidentifieringsrisk: CNIL kräver att organisationer genomför en bedömning av återidentifieringsrisk innan de påstår att data är anonymiserad. Bedömningen måste ta hänsyn till: "motivated intruder" testet (kan en motiverad individ återidentifiera datan?), tillgängliga hjälpdatauppsättningar och den specifika kontexten för datan.

CNIL:s överväganden för PII-detektion på franska

För organisationer som behandlar data på franska kräver CNIL:s riktlinjer implicit att PII-detekteringsverktyg täcker fransk-språkig PII. Franska specifika entitetstyper som måste detekteras:

  • Numéro de Sécurité Sociale (NIR): 13-siffrigt franskt socialförsäkringsnummer med specifik formatvalidering
  • Carte vitale-nummer: Identifierare för sjukförsäkringskort som används i fransk sjukvårdsadministration
  • Numéro d'identification au répertoire (NIR): Identifierare för befolkningsregister
  • SIRET/SIREN: Företagsidentifierare som kan förekomma i personliga affärssammanhang
  • Numéro d'ordre professionnel: Professionella registreringsnummer (läkare, advokater, revisorer)
  • Carte nationale d'identité (CNI): Nummer på fransk nationell ID-kort

Franska NER-modeller för personnamnsdetektion måste också hantera franska namngivningskonventioner: sammansatta namn (Jean-Pierre), bindestrecksnamn, partiklar (de, du, des) och franska specifika namn mönster.

CNIL:s verkställighet: AI-bötesmönstret

CNIL:s verkställighetsåtgärder mot AI-system etablerar prejudikat för vad "tillräckliga tekniska åtgärder" betyder i AI-sammanhang:

Clearview AI (20 miljoner euro böter, 2022): Behandling av biometriska data från franska individer utan rättslig grund, insamlade från offentliga webbkällor. Fastställde att bulk web-scraping av personuppgifter för AI-träning kräver uttrycklig rättslig grund.

TikTok-utredning (2024-2025 pågående): Fokuserade på algoritmiska rekommendationssystem som kan härleda känsliga kategorier från beteendedata. CNIL:s utredningsmetodik har blivit EU-standard för granskningar av AI-system.

Granskning av generativ AI (2024-2025): CNIL genomförde systematiska granskningar av LLM-leverantörer som verkar i Frankrike, med fokus på ursprunget av träningsdata och anonymisering. Leverantörer utan dokumenterade anonymiseringsprocedurer för franska användares data krävdes att implementera kontroller.

Mönstret: CNIL:s verkställighet fokuserar på teknisk otillräcklighet — avsaknaden av dokumenterade tekniska kontroller — snarare än enbart på procedurala överträdelser.

Implementering av CNIL-kompatibel anonymiseringsdokumentation

För franska organisationer eller organisationer som betjänar franska användare kräver en CNIL-kompatibel anonymiseringsställning:

1. Fiche d'anonymisation (anonymiseringsregister) för varje behandlingsaktivitet:

  • Behandlingssyfte och datakategorier
  • Tillämpad anonymiseringsteknik (med parametrar)
  • Utfall av bedömning av återidentifieringsrisk
  • Valideringsmetod (testning, extern granskning)
  • Ansvarig person och granskningsdatum

2. Förbehandling för AI-system:

  • Dokumentera PII-detekteringsverktyget och konfigurationen som används
  • Registrera de detekterade och borttagna/pseudonymiserade entitetstyperna
  • Upprätthålla behandlingsloggar för CNIL:s granskningsförfrågningar

3. Fransk-språkig PII-täckning:

  • Verifiera detekteringstäckning för fransk-specifika identifierare (NIR, carte vitale, CNI)
  • Validera franska NER-modellens prestanda på franska personnamn
  • Dokumentera täckningsluckor och kompenserande kontroller

4. Ursprunget av träningsdata:

  • För AI-system tränade på web-scraped data: dokumentera källdatasetets anonymiseringsbedömning
  • För AI-system tränade på användardata: dokumentera anonymiseringsprocessen för användardata

CNIL:s inspektionsförfrågningar för AI-system inkluderar rutinmässigt begärningar om dessa dokument. Organisationer med befintlig dokumentation uppfyller inspektionskraven betydligt snabbare än de som genomför bedömningar reaktivt.

Källor:

Redo att skydda din data?

Börja anonymisera PII med 285+ entitetstyper på 48 språk.