anonym.legal

By · Last updated 2026-06-05

Terug na BlogGDPR & Nakoming

CNIL Frankryk: DPA PII-instrumentvereistes

CNIL het in 2023 16 433 klagtes verwerk (+43%). 63% van CNIL-kennisgewings verwys na onvoldoende KI-anonimisering. NIR/Franse SSN word deur 78% van generiese instrumente gemis.

June 5, 20269 min lees
France CNILNIR French SSNGDPR anonymizationFrench data protectionAI training data

CNIL Frankryk: DPA PII-instrumentvereistes

Frankryk se CNIL is die EU se mees veeleisende dataowerheid. Die meeste EU-reguleerders skryf bree reels. CNIL gaan verder. Dit publiseer presiese tegniese leiding wat recommandations genoem word. Hierdie stel presiese standaarde vir anonimisering en KI-datagebruik.

CNIL-kennisgewings in 2024 het dikwels swak anonimisering in KI-stelsels aangehaal. Die agentskap het in 2023 16 433 klagtes ontvang. Dit was 43% meer as in 2022.

CNIL-leiding Beïnvloed EU-beleid

CNIL se tegniese tekste word wyd deur ander EU-DPA's aangehaal. Twee gidse is die belangrikste.

Guide pratique de l'anonymisation (2023): Hierdie gids dek k-anonimiteit, l-diversiteit, en differensiele privaatheid. Dit wys hoe om elke metode op Franse data toe te pas. Swede se IMY en ander EU-liggame haal dit aan in hul eie reels.

KI-stelsels leiding (2024): CNIL lys ses datatipes wat hanteer moet word in KI-opleiding. Geen ander EU-DPA het so ver gegaan oor KI nie.

Koekie-reels: CNIL se koekie-leiding stel die hoogste tegniese standaard vir toestemmingsinstrumente in die EU. Dit word gereeld opgedateer.

Die NIR: Frankryk se Mees Sensitiewe Identifiseerder

Die Numero d'Inscription au Repertoire (NIR) -- ook genoem die numéro de securite sociale -- is 'n 15-syfer Franse sosiale sekuriteitsnommer.

Die formaat is: S AA MM DD CCC OOO K

  • S -- 1 syfer: geslag
  • AA -- geboortejaar
  • MM -- geboortemaand
  • DD -- geboorte-departement (01-95, 2A/2B vir Korsika, 97-99 oorsee, 99 buiteland)
  • CCC -- munisipaliteitskode
  • OOO -- geboortevolgorde
  • K -- 2-syfer-kontrolesleutel (97 - (NIR mod 97))

Die NIR hou geslag, geboortedatum, en geboorteplek in een nommer. CNIL behandel dit as hoe risiko. Dit benodig dieselfde sorg as spesiale-kategorie-data onder GDPR Artikel 9.

Waarom instrumente NIR mis: Generiese NLP-instrumente misluk op NIR om drie redes. Eerstens lyk die 15 syfers (dikwels sonder spasies geskryf) soos ander lang nommers. Tweedens hou syfers 7-11 'n departementskode. Instrumente wat die mod-97-kontrole oorsla laat vals positiewes deur. Derdens gebruik Korsikaanse departemente 2A en 2B, nie suiwer syfers nie. Instrumente gebou vir slegs-numeriese patrone misluk hier.

Goeie NIR-opsporing vereis drie dinge: mod-97-sleutelkontrole, 'n geografiese kodeboek, en Korsika-bewuste reels.

Sien ons sekuriteitsnakomingsoorsig vir hoe identifiseerdersdekking in 'n GDPR-waarborgstapel pas.

SIREN en SIRET: Besigheids-ID's in Persoonlike Leers

SIREN: 'n 9-syfer Franse maatskappy-ID met 'n Luhn-kontrolesyfer. Dit verskyn in alle Franse kommersiële dokumente.

SIRET: 'n 14-syfer-nommer wat uit SIREN (9 syfers) plus 'n vestigingskode (5 syfers) saamgestel is. SIRET benoem 'n perseel. SIREN benoem die maatskappy.

Sakelêers hou dikwels SIRET-nommers langs personeelname. CNIL behandel SIRET plus 'n naam as persoonlike data. Daai paar aktiveer GDPR-reels selfs sonder 'n afsonderlike persoonlike dataveld.

Ses Anonimiseringststappe vir KI-opleiding

CNIL se 2024 KI-leiding dek ses datatipes. Elkeen moet hanteer word voordat Franse persoonlike rekords in KI-opleiding gebruik word:

  1. Verwyder direkte identifiseerders -- Name, NIR, SIREN moet vervang of verwyder word
  2. Veralgemeen kwasi-identifiseerders -- Ouderdom, departement, beroep kan saam mense heridentifiseer; verminder hul presisie
  3. Voeg ruis by getalle -- Numeriese velde benodig gekalibreerde ruis om inferensie te blokkeer
  4. Kontroleer k-anonimiteit -- Elke persoon moet soos ten minste k-1 ander lyk; CNIL wys na k ≥ 5
  5. Kontroleer l-diversiteit -- Sensitiewe attribute moet binne elke groep wissel
  6. Doen 'n heridentifikasierisikokontrole -- Gebruik 'n gedokumenteerde metode voor enige datavrystellin

Slegs die NIR en volle naam verwyder is nie genoeg nie. CNIL het dit in handhawing gevind. Kwasi-identifiseerders soos posbus en mediese spesialiteit benodig ook behandeling.

Ons GDPR-nakomingsgids dek die rekords wat Franse DPA-ouditte verwag.

Taalkonteks vir Franse PII-opsporing

Frankryk het verskeie taalkundige kontekste wat opsporing beïnvloed.

Standaard Frans is die taal van alle amptelike dokumente. NER-modelle moet geaksentueerde letters hanteer: e, e, e, e, a, a, i, o, u, c, oe.

Oorsese gebiede (DOM-TOM): Martinique, Guadeloupe, Reunion, Guyane, en Mayotte gebruik NIR-kodes in die 97-98-reeks. Plaaslike naampatrone verskil van die Franse vasteland.

Elsas-Moselle: Duits-afkomstige name en sommige Duitse dokumentformate verskyn in Franse rekords. Modelle wat slegs op standaard Frans opgelei is, kan hierdie mis.

Grensoverschrydende gebruik: Belgiese Frans gebruik 'n ander ID-formaat. Instrumente wat in Frankryk en Belgie gebruik word, benodig reels vir elkeen.

Wat U Instrument Moet Dek

Franse nakoming vereis vier tegniese vermoens:

  1. NIR met mod-97-kontrole -- Patroonpassing alleen misluk. Instrumente moet die sleutelkontrole uitvoer en 2A/2B-kodes hanteer.
  2. SIREN/SIRET met Luhn-kontrole -- Besigheids-ID's verskyn in persoonlike leers en skep GDPR-gedekte naamkombinasies.
  3. Franse NER met volle aksent-ondersteuning -- Moet saamgestelde name (Jean-Pierre), partikels (de, du, des), en geaksentueerde karakters hanteer.
  4. Gedokumenteerde ses-stap-proses -- Enige KI-opleidingspypleiding op Franse data benodig 'n geskrewe rekord vir elke anonimiseringsaktiwiteit.

Bronne

Gereed om u data te beskerm?

Begin om PII te anonimiseer met 285+ entiteitstipes in 48 tale.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.