CNIL Francija: DPA PII riku prasibas
Francijas CNIL ir ES prasìgàkà datu iestàde. Vairums ES regulatoru raksta plaSus noteikumus. CNIL iet tàlàk. Tà publicè precìzus tehniskus norSolumus, kurus sauc recommandations. Tie nosaka precizus standartus anonimizàcijai un AI datu izmantošanai.
CNIL paziñojumos 2024. gadà bieži minèja vàju anonimizàciju AI sistèmàs. Agentura 2023. gadà sanèma 16 433 sùdzibas. Tas bija par 43% vairày nekà 2022. gadà.
CNIL norSolumi veido ES politiku
CNIL tehniskie teksti tiek plaSi citèti citu ES DPA ietvaros. Divi rokasgràmati ir vissvarìgàkàs.
Guide pratique de l'anonymisation (2023): Sìs rokasgramata aptver k-anonimitàti, l-dazàdìbu un diferenciàlo privatumu. Tà paradà, kà izmantot katru metodi uz francu datiem. Zviedrijas IMY un citas ES iestàdes citè to savosnoteikumos.
AI sistèmu norSolumi (2024): CNIL uzrada seSus datu tipus, kas ir japàrvàlda AI apmacibà. Neviens cits ES DPA tik tàlu nav aiziets AI jomà.
Sikdatnu noteikumi: CNIL sikdatnu norSolumi nosaka augstàko tehnikas slieksni piekriSanas rikiem ES. Tà tiek bieži atjauninàta.
NIR: Francijas jutìgàkais identifikators
Numéro d'Inscription au Répertoire (NIR) -- saukts ari par numéro de sécurité sociale -- ir 15 ciparu francu sociàlàs nodroSinàSanas numurs.
Tà formàts ir: S AA MM DD CCC OOO K
- S -- 1 cipars: dzimums
- AA -- dzimSanas gads
- MM -- dzimSanas mènesis
- DD -- dzimSanas departaments (01-95, 2A/2B Korsikai, 97-99 aizjùras, 99 àrzemnieki)
- CCC -- pasvaldibas kods
- OOO -- dzimSanas kàrtiba
- K -- 2 ciparu pàrbaudes atslega (97 - (NIR mod 97))
NIR satur dzimumu, dzimSanas datumu un dzimSanas vietu vienà numurà. CNIL to uzskata par augsta riska identifikatoru. Tam ir vajadziga tàda pati apstrSade kà ìpaSet kategiorijas datiem saskaña ar VDAR 9. pantu.
Kapèc riki palaid garâm NIR: VispàrèJie NLP riki kLùdàs ar NIR trIs iemeslu dèL. Pirmkàrt, 15 cipari (bieži rakstìti bez atstarpèm) izskata kà citi gari skaitli. Otrkàrt, cipari 7.-11. vietà satur departamenta kodu. Riki, kas izlaiZ mod-97 pàrbaudi, laiZ cauri viltus pozitìvus. TreSàm, Korsijas departamenti izmanto 2A un 2B, ne tìrus ciparus. Riki, kas veidoti tikai skaitliskiem paraugiem, te neiztur.
Lab NIR atklaSanai ir vajadzigs trìs lietas: mod-97 atslègas pàrbaude, geogràfiskà kodexgrâmata un Korsikai pielàgoti noteikumi.
Skatiet musu drosibas atbilstibas parskatu, kà identifikatoru pàrklàjums iederas VDAR aizsardzibas kàrtà.
SIREN un SIRET: uznemumu ID personas failos
SIREN: 9 ciparu francu uznemuma ID ar Luhn pàrbaudes ciparu. ParàdàS visos francu komerciales dokumentos.
SIRET: 14 ciparu numurs, kas veidots no SIREN (9 cipari) plus uznemuma kods (5 cipari). SIRET apzime vietni. SIREN apzime uznemumu.
Uznemumu faili bieži satur SIRET numurus blakus darbinieku vàrdiem. CNIL uzskata SIRET plus vàrds kà personas datus. Sis pàris aktivizè VDAR noteikumus pat bez atseviSKa personas datu lauka.
Sesi anonimizàcijas soLi AI apmacibai
CNIL 2024. gada AI norSolumi aptver Sešus datu tipus. Katrs ir jàapstrào pirms francu personas ierakstu izmantošanas AI apmacibà:
- Nodzest tieS os identifikatorus -- Vàrdi, NIR, SIREN ir jàaizvieto vai jàatceLl
- VispàrèLt kvazi-identifikatorus -- Vecums, departaments, profesija var kopà atkàrtoti identificèt cilvèkus; samazinàt to precizitàti
- Pievienot trokšñus skaitliem -- Skaitliskajiem laukiem ir vajadzigs kalibrèts trokšñis, lai bloKètu datu iegusanu
- Pàrbaudìt k-anonimitàti -- Katram cilvèkam ir jabut lìdzigam vismaz k-1 citiem; CNIL norà uz k >= 5
- Pàrbaudìt l-dazàdìbu -- Jutìgajiem atributiem ir jàmainàs katrà grupà
- Veikt atkàrtotas identifikàcijas riska pàrbaudi -- Izmantot dokumentètu metodi pirms jebkuras datu izlaiSanas
Tikai NIR un pilna vàrda nodzèSana nav pietiekama. CNIL to ir konstatèjis izpildè. Kvazi-identifikatoriem kà pasta indeks un medicìniskà specialitàte ari ir vajadziga apstrSade.
Musu VDAR atbilstibas rokasgramata aptver ierakstus, ko francu DPA auditi sagaida.
Valodas konteksts francu PII atklaSanai
Francijà ir vairaki valodas konteksti, kas ietekme atklaSanu.
Standarta franèu ir visu oficijàlo dokumentu valoda. NER modeLiem ir jasuposta akcentèti burti: é, è, ê, ë, à, â, î, ô, û, ç, œ.
Aizjùras teritorijas (DOM-TOM): Martinikas, Gvadelupes, Reinjona, Gvianas un Majota izmanto NIR kodus 97.-98. diapazonà. Vietèje vàrdu paraugi atSKiras no kontinentàLàs Francijas.
Alzasa-Mozele: Vàcu izcelsmes vàrdi un dazi vàcu dokumentu formàti paradàs francu ierakstos. ModeLi, kas apmacìti tikai uz standarta francu valodu, var palaid Šo garâm.
Pàrrobezu izmantošana: BeL'gijas francu valodà tiek izmantots atSKirigs ID formàts. Riki, kas tiek lietoti Francijà un BeL'gijà, prasa noteikumus abiem.
Kas jùsu rikam ir jàaptver
Francu atbilstiba prasa cetras tehniskàs spèjas:
- NIR ar mod-97 pàrbaudi -- Tikai paraugu saskanošana neizdodas. Rikiem ir jàveic atslègas pàrbaude un 2A/2B kodi ir jàapstrSadà.
- SIREN/SIRET ar Luhn pàrbaudi -- Uznemumu ID paradàs personas failos un izveido VDAR aptvertos vàrdu kombinàcijas.
- Francu NER ar pilnu akcenta atbalstu -- Ir jalaimao salikti vàrdi (Jean-Pierre), partikulas (de, du, des) un akcentèti rakstzìmes.
- Dokumentèts sesu soLu process -- Jebkuram AI apmacibas konveijeram uz francu datiem ir vajadzigs rakstisks ieraksts katrai anonimizàcijas aktivitàtei.