anonym.legal

By · Last updated 2026-06-05

Terug naar BlogGDPR & Naleving

CNIL Frankrijk: DPA PII-tooltechnische vereisten

CNIL behandelde 16.433 klachten in 2023 (+43%). 63% van de CNIL-aanwijzingen citeert ontoereikende AI-anonimisering. NIR/Frans socialezekerheids nummer gemist door 78% van de generieke tools.

June 5, 20269 min lezen
France CNILNIR French SSNGDPR anonymizationFrench data protectionAI training data

CNIL Frankrijk: DPA PII-tooltechnische vereisten

Frankrijks CNIL is de meest veeleisende gegevensbeschermingsinstantie van de EU. De meeste EU-toezichthouders schrijven brede regels. De CNIL gaat verder en publiceert precieze technische richtsnoeren — recommandations — die exacte normen stellen voor anonimisering en AI-gegevensgebruik.

CNIL-aanwijzingen in 2024 citeerden vaak zwakke anonimisering in AI-systemen. De instantie ontving in 2023 16.433 klachten — 43% meer dan in 2022.

CNIL-richtsnoeren vormen EU-beleid

CNIL's technische teksten worden breed geciteerd door andere EU-DPA's. Twee gidsen tellen het meest.

Guide pratique de l'anonymisation (2023): Deze gids behandelt k-anonimiteit, l-diversiteit en differentiële privacy. Ze toont hoe elke methode op Franse gegevens wordt toegepast. Zweden's IMY en andere EU-instanties citeren hem in hun eigen regels.

AI-systeemrichtsnoeren (2024): CNIL somt zes gegevenstypen op die moeten worden afgehandeld vóór gebruik van Franse persoonsgegevens in AI-training. Geen andere EU-DPA is zo ver gegaan op het gebied van AI.

Cookieregels: CNIL's cookierichtsnoeren stellen de hoogste technische lat voor consenttools in de EU en worden regelmatig bijgewerkt.

Het NIR: Frankrijk's meest gevoelige identificator

Het Numéro d'Inscription au Répertoire (NIR) — ook numéro de sécurité sociale — is een 15-cijferig Frans socialezekerheids nummer.

Het formaat is: S AA MM DD CCC OOO K

  • S — 1 cijfer: geslacht
  • AA — geboortejaar
  • MM — geboortemaand
  • DD — geboortedepartement (01–95, 2A/2B voor Corsica, 97–99 overzeese gebieden, 99 buitenland)
  • CCC — gemeentecode
  • OOO — geboortevolgorde
  • K — 2-cijferige controlesleutel (97 − (NIR mod 97))

Het NIR bevat geslacht, geboortedatum en geboorteplaats in één nummer. CNIL behandelt het als hoog-risico en vereist dezelfde zorg als bijzondere categoriegegevens onder AVG Artikel 9.

Waarom tools NIR missen: Generieke NLP-tools falen bij NIR om drie redenen. Ten eerste zien de 15 cijfers (vaak zonder tussenruimtes geschreven) eruit als andere lange nummers. Ten tweede bevatten cijfers 7–11 een departementcode; tools die de mod-97-controle overslaan, laten vals-positieven door. Ten derde gebruiken Corsicaanse departementen 2A en 2B, niet puur numeriek — tools gebouwd voor alleen-numerieke patronen falen hier.

Goede NIR-detectie vereist drie dingen: mod-97-sleutelcontrole, een geografisch codeboek en Corsica-bewuste regels.

Zie ons beveiligings-en nalevingsoverzicht voor hoe identificatordekking past in een AVG-beveiligingsstack.

SIREN en SIRET: bedrijfs-ID's in persoonlijke bestanden

SIREN: Een 9-cijferig Frans bedrijfs-ID met een Luhn-controlecijfer. Verschijnt in alle Franse commerciële documenten.

SIRET: Een 14-cijferig nummer opgebouwd uit SIREN (9 cijfers) plus een vestigingscode (5 cijfers). SIRET identificeert een locatie; SIREN het bedrijf.

Bedrijfsbestanden bevatten vaak SIRET-nummers naast personeelsnamen. CNIL behandelt SIRET plus een naam als persoonsgegevens. Dit paar activeert AVG-regels zelfs zonder apart persoonlijk gegevensveld.

Zes anonimiseringsstappen voor AI-training

CNIL's 2024 AI-richtsnoeren behandelen zes gegevenstypen die elk moeten worden afgehandeld vóór gebruik van Franse persoonsgegevens in AI-training:

  1. Verwijder directe identificatoren — Namen, NIR, SIREN moeten worden vervangen of verwijderd
  2. Generaliseer quasi-identificatoren — Leeftijd, departement en beroep samen kunnen mensen heridentificeren; verminder hun precisie
  3. Voeg ruis toe aan getallen — Numerieke velden vereisen gekalibreerde ruis om inferentie te blokkeren
  4. Controleer k-anonimiteit — Elke persoon moet lijken op minimaal k-1 anderen; CNIL wijst op k ≥ 5
  5. Controleer l-diversiteit — Gevoelige kenmerken moeten variëren binnen elke groep
  6. Voer een heridentificatierisicocontrole uit — Gebruik een gedocumenteerde methode vóór elke gegevensvrijgave

Alleen NIR en volledige naam verwijderen is niet voldoende. CNIL heeft dit in handhaving gevonden. Quasi-identificatoren zoals postcode en medische specialisatie vereisen ook behandeling.

Onze AVG-nalevingsgids behandelt de registers die Franse DPA-audits verwachten te zien.

Taalcontext voor Franse PII-detectie

Frankrijk heeft verschillende taalcontexten die detectie beïnvloeden.

Standaard Frans is de taal van alle officiële documenten. NER-modellen moeten geaccentueerde letters verwerken: é, è, ê, ë, à, â, î, ô, û, ç, œ.

Overzeese gebiedsdelen (DOM-TOM): Martinique, Guadeloupe, Réunion, Guyane en Mayotte gebruiken NIR-codes in de reeksen 97–98. Lokale naampatronen wijken af van het Franse vasteland.

Elzas-Moselle: Duits-afkomstige namen en sommige Duitse documentformaten verschijnen in Franse dossiers. Op standaard Frans getrainde modellen kunnen deze missen.

Grensoverschrijdend gebruik: Belgisch Frans hanteert een ander ID-formaat. Tools die in Frankrijk en België worden gebruikt, vereisen regels voor elk land.

Wat uw tool moet dekken

Franse naleving vereist vier technische mogelijkheden:

  1. NIR met mod-97-controle — Patroonherkenning alleen faalt. Tools moeten de sleutelcontrole uitvoeren en 2A/2B-codes verwerken.
  2. SIREN/SIRET met Luhn-controle — Bedrijfs-ID's verschijnen in persoonlijke bestanden en creëren AVG-gedekte naamcombinaties.
  3. Franse NER met volledige accentondersteuning — Moet samengestelde namen (Jean-Pierre), partikels (de, du, des) en geaccentueerde tekens verwerken.
  4. Gedocumenteerd zessteppen-proces — Elke AI-trainingspipeline op Franse gegevens vereist een schriftelijk register voor elke anonimiseringsactiviteit.

Bronnen

Klaar om uw gegevens te beschermen?

Begin met het anonimiseren van PII met 285+ entiteitstypen in 48 talen.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.