CNIL Francúzsko: Technicke poziadavky DPA na nástroje pre osobné udaje
Francúzsky CNIL je najnárocnejsím orgánom ochrany udajov v EÚ. Väcsina europskych regulátorov formuluje siroko nastavené pravidlá. CNIL ide dalej. Vydáva presné technicke usmernenia nazývané recommandations. Tieto stanovujú exaktné normy pre anonymizáciu a pouzitie údajov v AI.
CNIL dostal v roku 2023 celkovo 16 433 sazností. To bolo o 43 % viac ako v roku 2022. Oznámenia CNIL v roku 2024 casto poukazovali na slabú anonymizáciu v systémoch AI.
Usmernenia CNIL formujú politiku EÚ
Technicke texty CNIL citujú casto aj iné orgány ochrany udajov EÚ. Dva dokumenty sú najdôlezitejsie.
Guide pratique de l'anonymisation (2023): Tento sprievodca pokryva k-anonymitu, l-diverzitu a diferenciálne súkromie. Ukazuje, ako pouzit jednotlivé metódy na francúzske údaje. Citujú ho Svédska IMY a dalsia orgány EÚ vo vlastnych pravidlách.
Usmernenie pre AI systémy (2024): CNIL uvádza sest typov údajov, s ktorymi treba naklada» pred pouzitím v trénovaní AI. Ziadny iný orgán EÚ nezasiel pri AI takto ¿aleko.
Pravidlá cookies: Usmernenia CNIL pre cookies stanovujú najvyssiu technickú latku pre nástroje súhlasu v EÚ. Su pravidelne aktualizované.
NIR: Najcitlivejsí francúzsky identifikátor
Numéro d'Inscription au Répertoire (NIR) — nazyvany aj numéro de sécurité sociale — je 15-miestné francúzske cislo socialneho zabezpecenia.
Ego formát je: `S AA MM DD CCC OOO K`
- S — 1 cifra: pohlavie
- AA — rok narodenia
- MM — mesiac narodenia
- DD — département narodenia (01-95, 2A/2B pre Korziku, 97-99 zámorské, 99 zahranicní)
- CCC — kód obce
- OOO — poradie narodenia
- K — 2-ciferny kontrolny klúc (97 - (NIR mod 97))
NIR obsahuje pohlavie, dátum narodenia a miesto narodenia v jednom cisle. CNIL ho poklada za vysoko rizikové. Vyzaduje rovnakú starostlivost ako datos osobitnch kategorií podla clanku 9 GDPR.
Preco nástroje NIR prehliadajú: Generické NLP nástroje zlyhávajú pri NIR z troch dôvodov. Po prvé, 15 cifier (casto písanych bez medzier) vyzerá podobne ako iné dlhé cisla. Po druhé, cifry 7-11 obsahujú kód départementu. Nástroje, ktoré preskocía kontrolu mod-97, prepustia falzivne pozitívy. Po tretie, korzické départementy pouzívajú 2A a 2B, nie ciste cifry. Nástroje zostavené len pre ciselné vzory tu zlyhávajú.
Spolahlivá detekcia NIR vyzaduje tri veci: kontrolu klúca mod-97, geograficky kódex a pravidlá zohladnujúce Korziku.
Ako zaradame pokrytie identifikátorov do zásobníka záruk GDPR sa dozviete v nasej prehlad bezpecnosti a suladnosti.
SIREN a SIRET: Obchodné ID v osobnych súboroch
SIREN: 9-miestné francúzske firemné ID s Luhnovou kontrolnou cifrou. Vyskytuje sa vo vsetkych francúzskych obchodnych dokumentoch.
SIRET: 14-miestné cislo vytvorené zo SIREN (9 cifier) plus kód prevádzkarne (5 cifier). SIRET identifikuje miesto. SIREN identifikuje spolocnost.
Podnikové súbory casto obsahujú cisla SIRET vedla mien zamestnancov. CNIL pokladá SIRET spolu s menom za osobné udaje. Tato kombinácia spústa pravidlá GDPR aj bez osobitného pola osobnych udajov.
Sest krokov anonymizácie pre trenovanie AI
Usmernenie CNIL pre AI z roku 2024 pokryva sest typov udajov. Kazdy musí byt osetreny pred pouzitím francúzskych osobnych udajov pri trénovaní AI:
- Odstránit priame identifikátory — Mená, NIR, SIREN musia byt nahradené alebo zmazané.
- Osetrenie kvazi-identifikátorov — Vek, pohlavie a povolanie môzu spolocne umoznit reindetifikáciu. Pouzite k-anonymitu.
- Geo údaje — Presné adresy musia byt zhrubené na département alebo región.
- Casové razítka — Presné casové razítka môzu identifikovat osoby z vzorcov. Zhrubte ich na mesiac alebo tvrrok.
- Voñy text — Pole volného textu casto obsahuje mená, adresy a zdravotné zmienky. NER musí byt pouzity pred spracovaním.
- Syntetické údaje — Pre vysoko rizikove sady je syntetická generácia preferovana pred anonymizáciou.
Technické poziadavky CNIL pre francúzske osobné udaje
Pre francúzske záznamy musí vás nástroj:
- Pouzívat kontrolu klúca mod-97 pre NIR
- Spracovat kód départementu vrátane 2A a 2B pre Korziku
- Pouzívat Luhnovu kontrolu pre SIREN
- Detekovát SIRET ako kombinovany identifikátor
- Pouzívat francúzsky NER pre mená a adresy
- Zaznamenat kazdy krok spracovania pre potreby auditu
Nástroje pouzivajúce iba anglické modely detegujú NIR v 22 % prípadov. Nástroje so specifickymi pravidlami pre Francúzsko dosahujú viac ako 95 %.
Pozrite si, ako anonym.legal spracúva francúzske identifikátory: /entities.