By · Last updated 2026-06-05

Späť na blogGDPR a Dodržiavanie

CNIL Francúzsko: Technicke poziadavky na nástroje pre PII

CNIL v roku 2023 vybavil 16 433 sazností (+43 %). 63 % oznámení CNIL cituje nedostatocnú anonymizáciu AI. Generické nástroje prehliadajú NIR/francúzske rodné cislo v 78 % prípadov.

June 5, 20269 min čítania
France CNILNIR French SSNGDPR anonymizationFrench data protectionAI training data

CNIL Francúzsko: Technicke poziadavky DPA na nástroje pre osobné udaje

Francúzsky CNIL je najnárocnejsím orgánom ochrany udajov v EÚ. Väcsina europskych regulátorov formuluje siroko nastavené pravidlá. CNIL ide dalej. Vydáva presné technicke usmernenia nazývané recommandations. Tieto stanovujú exaktné normy pre anonymizáciu a pouzitie údajov v AI.

CNIL dostal v roku 2023 celkovo 16 433 sazností. To bolo o 43 % viac ako v roku 2022. Oznámenia CNIL v roku 2024 casto poukazovali na slabú anonymizáciu v systémoch AI.

Usmernenia CNIL formujú politiku EÚ

Technicke texty CNIL citujú casto aj iné orgány ochrany udajov EÚ. Dva dokumenty sú najdôlezitejsie.

Guide pratique de l'anonymisation (2023): Tento sprievodca pokryva k-anonymitu, l-diverzitu a diferenciálne súkromie. Ukazuje, ako pouzit jednotlivé metódy na francúzske údaje. Citujú ho Svédska IMY a dalsia orgány EÚ vo vlastnych pravidlách.

Usmernenie pre AI systémy (2024): CNIL uvádza sest typov údajov, s ktorymi treba naklada» pred pouzitím v trénovaní AI. Ziadny iný orgán EÚ nezasiel pri AI takto ¿aleko.

Pravidlá cookies: Usmernenia CNIL pre cookies stanovujú najvyssiu technickú latku pre nástroje súhlasu v EÚ. Su pravidelne aktualizované.

NIR: Najcitlivejsí francúzsky identifikátor

Numéro d'Inscription au Répertoire (NIR) — nazyvany aj numéro de sécurité sociale — je 15-miestné francúzske cislo socialneho zabezpecenia.

Ego formát je: `S AA MM DD CCC OOO K`

  • S — 1 cifra: pohlavie
  • AA — rok narodenia
  • MM — mesiac narodenia
  • DD — département narodenia (01-95, 2A/2B pre Korziku, 97-99 zámorské, 99 zahranicní)
  • CCC — kód obce
  • OOO — poradie narodenia
  • K — 2-ciferny kontrolny klúc (97 - (NIR mod 97))

NIR obsahuje pohlavie, dátum narodenia a miesto narodenia v jednom cisle. CNIL ho poklada za vysoko rizikové. Vyzaduje rovnakú starostlivost ako datos osobitnch kategorií podla clanku 9 GDPR.

Preco nástroje NIR prehliadajú: Generické NLP nástroje zlyhávajú pri NIR z troch dôvodov. Po prvé, 15 cifier (casto písanych bez medzier) vyzerá podobne ako iné dlhé cisla. Po druhé, cifry 7-11 obsahujú kód départementu. Nástroje, ktoré preskocía kontrolu mod-97, prepustia falzivne pozitívy. Po tretie, korzické départementy pouzívajú 2A a 2B, nie ciste cifry. Nástroje zostavené len pre ciselné vzory tu zlyhávajú.

Spolahlivá detekcia NIR vyzaduje tri veci: kontrolu klúca mod-97, geograficky kódex a pravidlá zohladnujúce Korziku.

Ako zaradame pokrytie identifikátorov do zásobníka záruk GDPR sa dozviete v nasej prehlad bezpecnosti a suladnosti.

SIREN a SIRET: Obchodné ID v osobnych súboroch

SIREN: 9-miestné francúzske firemné ID s Luhnovou kontrolnou cifrou. Vyskytuje sa vo vsetkych francúzskych obchodnych dokumentoch.

SIRET: 14-miestné cislo vytvorené zo SIREN (9 cifier) plus kód prevádzkarne (5 cifier). SIRET identifikuje miesto. SIREN identifikuje spolocnost.

Podnikové súbory casto obsahujú cisla SIRET vedla mien zamestnancov. CNIL pokladá SIRET spolu s menom za osobné udaje. Tato kombinácia spústa pravidlá GDPR aj bez osobitného pola osobnych udajov.

Sest krokov anonymizácie pre trenovanie AI

Usmernenie CNIL pre AI z roku 2024 pokryva sest typov udajov. Kazdy musí byt osetreny pred pouzitím francúzskych osobnych udajov pri trénovaní AI:

  1. Odstránit priame identifikátory — Mená, NIR, SIREN musia byt nahradené alebo zmazané.
  2. Osetrenie kvazi-identifikátorov — Vek, pohlavie a povolanie môzu spolocne umoznit reindetifikáciu. Pouzite k-anonymitu.
  3. Geo údaje — Presné adresy musia byt zhrubené na département alebo región.
  4. Casové razítka — Presné casové razítka môzu identifikovat osoby z vzorcov. Zhrubte ich na mesiac alebo tvrrok.
  5. Voñy text — Pole volného textu casto obsahuje mená, adresy a zdravotné zmienky. NER musí byt pouzity pred spracovaním.
  6. Syntetické údaje — Pre vysoko rizikove sady je syntetická generácia preferovana pred anonymizáciou.

Technické poziadavky CNIL pre francúzske osobné udaje

Pre francúzske záznamy musí vás nástroj:

  • Pouzívat kontrolu klúca mod-97 pre NIR
  • Spracovat kód départementu vrátane 2A a 2B pre Korziku
  • Pouzívat Luhnovu kontrolu pre SIREN
  • Detekovát SIRET ako kombinovany identifikátor
  • Pouzívat francúzsky NER pre mená a adresy
  • Zaznamenat kazdy krok spracovania pre potreby auditu

Nástroje pouzivajúce iba anglické modely detegujú NIR v 22 % prípadov. Nástroje so specifickymi pravidlami pre Francúzsko dosahujú viac ako 95 %.

Pozrite si, ako anonym.legal spracúva francúzske identifikátory: /entities.

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.