CNIL Frakkland: GDPR-tæknilegar reglufylgni
Strangasti persónuvernareftirlitsstofnun Frakklands
Persónuvernarstofnun Frakklands er CNIL. Hún setur nákvæmustu persónuverndarreglur ESB. Flestar ESB-eftirlitsstofnanir skrifa víðtækar leiðbeiningar. CNIL gengur lengra. Hún birtir nákvæmar tæknilegar skýringar sem kallast recommandations. Þær skilgreina hvað raunveruleg GDPR-reglufylgni lítur út.
Aðrar ESB-eftirlitsstofnanir afrita oft verk CNIL. Helstu textar eru Guide pratique de l'anonymisation frá 2023 og AI-leiðbeiningarnar frá 2024.
Tölurnar sýna að stofnunin er virk. Hún meðhöndlaði 16.433 kvartanir árið 2023. Það er 43% fleiri en 2022. Hún hefur gefið út um 150 milljóna evra í GDPR-sektir síðan framfylgni hófst.
AI-þjálfun: Sex skráategundir til að hreinsa
AI-leiðbeiningar CNIL frá 2024 gilda víðtækt. Þær ná yfir alla hópa sem þjálfa AI á frönsku persónuskrám. Þær gilda einnig um þá sem þjóna frönskum notendum með AI-verkfærum.
Stofnunin listar sex skráategundir sem þurfa hreinsunar áður en AI-þjálfun:
- Identifiants directs (bein auðkenni): Nöfn, heimilisföng, kennitölur. Fjarlægðu eða skiptu þessar áður en þjálfun hefst.
- Identifiants quasi-directs (hlutaauðkenni): Hópar einkenni sem leyfa endurauðkenningu. Beitu k-nafnleysis-athuganir.
- Données sensibles (sérstakir flokkar): Heilbrigðis-, lífrænt-, pólitískar og trúarlegar skrár. Einangraðu með viðbótarstjórnum.
- Données comportementales (notkunarskrár): Vafrusaga og notkunarmynstur. Samansafnaðu eða grímubúðu þessar.
- Données inférées (ályktaðar eiginleikar): AI-afleiddar merkingar úr notkun. Beitu tilgangsökunum.
- Données relatives aux mineurs (skrár um börn): Allar skrár tengdar einstaklingum undir 15 ára. Keyrðu aldursskoðanir og notaðu sterka hreinsun.
Notarðu LLM þjálfað á afrituðu efni? Þú þarft skriflega sönnun. Sýndu að þjálfunarskrár þínar voru farnar yfir og hreinsaðar. Sjá GDPR-reglufylgnileiðarvísir okkar fyrir gildissvið upplýsingar.
Nafnleysis-leiðarvísirinn: Grunnreglur
Leiðarvísirinn frá 2023 er nákvæmasti texti ESB um þetta efni. Hann setur stikuna fyrir hvað teljast raunverulega nafnlægar.
Samþykktar tækni:
- k-nafnleysi — hver skrá lítur út eins og að minnsta kosti k-1 aðrar
- l-fjölbreytni — viðkvæmar eiginleikar eru breytilegir innan hvers hóps
- Mismunur í persónuvernd — hávaði bætt við útgáfa tölfræði
- Dulnefni — áhættu-minnkunarþrep, ekki raunverulegt nafnleysi
Nauðsynlegar skrár:
Fyrir hverja starfsemi sem notar hreinsun býst CNIL við fiche d'anonymisation (nafnleysis-skrá). Hún verður að innihalda:
- Tæknina sem notuð er og lykilstillingar hennar (k-gildi, epsilon-gildi)
- Niðurstöður endurauðkenningar-áhættuathuganar
- Staðfestingaraðferðina (prófun eða ytri yfirferð)
- Ábyrgðarmannn og yfirferðardagsetningu
Endurauðkenningar-áhættuathugun:
Áður en skrár eru merktar nafnlægar, keyrðu formlega athugun. Spurðu: gæti hvattur aðili endurauðkennt þetta? Skoðaðu hvaða hjálpargagnasett eru til. Líttu á heildarsamhengi.
Franskar PII: Hvað verkfæri þín verða að finna
Franskar reglur krefja fransks-tungumála PII-þekju. Verkfæri þín verða að greina franskar sérstakar auðkenningsgerðir.
Lykil auðkenni til að þekja:
- NIR: 15 stafir (13 grunn + 2 stafa lykill). Þetta er franskt almannatryggingarnúmer.
- Carte vitale-númer: Sjúkratryggingarkortauðkenni.
- SIRET/SIREN: Fyrirtækisauðkenni sem finnast í persónulegum skrám.
- Numéro d'ordre professionnel: Skráningarnúmer lækna, lögfræðinga og endurskoðenda.
- CNI (Carte nationale d'identité): Franskt þjóðarskírteinisnúmer.
Frönsk NER-líkön verða að meðhöndla franskt nafnamynstur. Þetta inniheldur samsett nöfn (Jean-Pierre), agnir (de, du, des) og bandstriksnafn. Sjá fjöltungumála PII-greiningarleiðarvísir okkar um hvernig á að þekja allar staðsetningar.
Framfylgni: Hvað fær sektir
Sektir stofnunarinnar fylgja skýru mynstri. Þær beinast að vantar tæknilegar stjórnir. Léleg ferli ein eru sjaldan aðalmálið.
Clearview AI — 20 milljóna evra sekt (2022): Fyrirtækið vann lífrænar skrár Frakka án löglegrar grundvallar. Skrárnar voru skraffar af opinberum vefgögnum. Málið staðfesti: magn-vefskrafning fyrir AI-þjálfun þarfnast beinnar löglegrar grundvallar.
TikTok — rannsókn hafin 2024: Beindist að kerfum sem gætu ályktað viðkvæmar tegundir úr notkunarmerkjum. Þessi aðferð er nú ESB-tilvísun fyrir AI-endurskoðanir.
Endurgerandi AI-skoðun (2024–2025): Stofnunin fór yfir LLM söluaðila í Frakklandi. Hún beindist að uppruna þjálfunarefnis. Söluaðilar án fullnægjandi skráa þurftu að bæta við stjórnum.
Fjögur þrep til CNIL-reglufylgni
Meðhöndlarðu franskar persónuupplýsingar? Þú þarft fjóra hluti í gangi.
1. Nafnleysis-skrá fyrir hverja starfsemi
Hver starfsemi sem notar hreinsun þarf eigin skrá. Skráðu tæknina, stillingar hennar, áhættuniðurstöðu og yfirferðardagsetning.
2. Forvinnsluannálar fyrir AI
Skráðu hvaða PII-greinigaverkfæri þú notaðir. Skráðu hvaða einindategundir það fann. Skráðu hvað var fjarlægt eða grímubúið. Hafðu þessa annála tilbúna fyrir endurskoðanir.
3. Franskt-tungumála PII-þekja
Athugaðu að verkfærið þitt finnur NIR, carte vitale og CNI-númer. Prófaðu franskt NER-líkan þitt á raunverulegum frönskum nöfnum. Skráðu öll bil. Skráðu stjórnirnar sem þú setur í gang til að takast á við þær.
4. Upprunasskrár fyrir þjálfunarefni
Fyrir afritað efni: skráðu hreinsunarskoðun upprunans. Fyrir notendaskrár: skráðu hreinsunaferlið notandans. Öryggisreglufylgniyfirlit okkar sýnir hvernig þetta passar inn í víðtækara öryggisumhverfi.
Hópar með góðar skrár fara hratt í gegnum endurskoðanir. Byggðu skrána þína núna. Bíddu ekki eftir skoðun til að byrja.