By · Last updated 2026-06-05

Tilbage til BlogGDPR & Overholdelse

CNIL Frankrig: DPA-krav til PII-værktøjer

CNIL behandlede 16.433 klager i 2023 (+43 %). 63 % af CNIL-påbud anfører utilstrækkelig AI-anonymisering. NIR/fransk CPR-nummer overses af 78 % af generiske værktøjer.

June 5, 20269 min læsning
France CNILNIR French SSNGDPR anonymizationFrench data protectionAI training data

CNIL Frankrig: DPA-krav til PII-værktøjer

Frankrigs CNIL er EU's mest krævende dataorgan. De fleste EU-regulatorer skriver brede regler. CNIL går videre. Myndigheden offentliggør præcis teknisk vejledning kaldet recommandations. Disse fastsætter eksakte standarder for anonymisering og AI-databrug.

CNIL-påbud i 2024 nævnte ofte svag anonymisering i AI-systemer. Myndigheden modtog 16.433 klager i 2023. Det var 43 % mere end i 2022.

CNIL-vejledning former EU-politik

CNIL's tekniske tekster citeres bredt af andre EU-DPA'er. To vejledninger er vigtigst.

Guide pratique de l'anonymisation (2023): Denne vejledning dækker k-anonymitet, l-diversitet og differential privacy. Den viser, hvordan hver metode anvendes på franske data. Sveriges IMY og andre EU-organer citerer den i deres egne regler.

AI-systemvejledning (2024): CNIL opregner seks datatyper, der skal håndteres i AI-træning. Ingen anden EU-DPA er gået så langt med AI.

Cookie-regler: CNIL's cookie-vejledning fastsætter den højeste tekniske standard for samtykkeredskaber i EU. Den opdateres ofte.

NIR: Frankrigs mest følsomme identifikator

Numéro d'Inscription au Répertoire (NIR) — også kaldet numéro de sécurité sociale — er et 15-cifret fransk personnummer.

Formatet er: S AA MM DD CCC OOO K

  • S — 1 ciffer: køn
  • AA — fødselsår
  • MM — fødselsmåned
  • DD — fødselsafdeling (01–95, 2A/2B for Korsika, 97–99 oversøiske, 99 udland)
  • CCC — kommunekode
  • OOO — fødselsorden
  • K — 2-cifret kontrolnøgle (97 − (NIR mod 97))

NIR indeholder køn, fødselsdato og fødested i ét nummer. CNIL behandler det som højrisiko. Det kræver samme omhu som særlige kategorier af data under GDPR artikel 9.

Hvorfor værktøjer misser NIR: Generiske NLP-værktøjer fejler på NIR af tre grunde. Først ligner de 15 cifre (ofte skrevet uden mellemrum) andre lange tal. Dernæst indeholder cifre 7–11 en afdelingskode. Værktøjer, der springer mod-97-kontrollen over, lader falske positiver igennem. For det tredje bruger korsikanske afdelinger 2A og 2B, ikke rene cifre. Værktøjer bygget til kun numeriske mønstre fejler her.

God NIR-detektion kræver tre ting: mod-97 nøglekontrol, en geografisk kodebog og Korsika-bevidste regler.

Se vores sikkerheds-compliance-oversigt for, hvordan identifikatordækning indgår i en GDPR-sikkerhedsstabel.

SIREN og SIRET: Virksomheds-ID'er i personlige filer

SIREN: Et 9-cifret fransk virksomheds-ID med et Luhn-kontrolciffer. Det fremgår af alle franske handelsdokumenter.

SIRET: Et 14-cifret nummer opbygget af SIREN (9 cifre) plus en etableringskode (5 cifre). SIRET identificerer et sted. SIREN identificerer virksomheden.

Virksomhedsfiler indeholder ofte SIRET-numre ved siden af medarbejdernavne. CNIL behandler SIRET plus et navn som personoplysninger. Det par udløser GDPR-regler, selv uden et separat personoplysningsfelt.

Seks anonymiseringstrin til AI-træning

CNIL's AI-vejledning fra 2024 dækker seks datatyper. Hver skal håndteres, inden franske personoplysninger bruges i AI-træning:

  1. Fjern direkte identifikatorer — Navne, NIR, SIREN skal erstattes eller fjernes
  2. Generaliser kvasiidentifikatorer — Alder, afdeling, erhverv kan kombineres til genbrug af identitet; reducer deres præcision
  3. Tilføj støj til tal — Numeriske felter kræver kalibreret støj for at blokere inferens
  4. Tjek k-anonymitet — Hver person skal ligne mindst k-1 andre; CNIL peger på k ≥ 5
  5. Tjek l-diversitet — Følsomme attributter skal variere inden for hver gruppe
  6. Kør en risikocheck for genbrug af identitet — Brug en dokumenteret metode inden enhver dataudgivelse

Fjernelse af NIR og fulde navn alene er ikke nok. CNIL har fastslået dette ved håndhævelse. Kvasiidentifikatorer som postnummer og medicinsk speciale kræver også behandling.

Vores GDPR-compliance-vejledning dækker de registre, franske DPA-revisioner forventer at se.

Sprogkontekst for fransk PII-detektion

Frankrig har flere sproglige sammenhænge, der påvirker detektion.

Standard-fransk er sproget i alle officielle dokumenter. NER-modeller skal håndtere accenterede bogstaver: é, è, ê, ë, à, â, î, ô, û, ç, œ.

Oversøiske territorier (DOM-TOM): Martinique, Guadeloupe, Réunion, Guyane og Mayotte bruger NIR-koder i intervallet 97–98. Lokale navnemønstre adskiller sig fra det franske fastland.

Alsace-Moselle: Tysksprogede navne og visse tyske dokumentformater forekommer i franske registre. Modeller udelukkende trænet på standard-fransk kan overse disse.

Grænseoverskridende brug: Belgisk fransk bruger et andet ID-format. Værktøjer, der bruges i Frankrig og Belgien, kræver regler for hvert land.

Hvad dit værktøj skal dække

Fransk compliance kræver fire tekniske evner:

  1. NIR med mod-97-kontrol — Mønstermatching alene fejler. Værktøjer skal køre nøglekontrollen og håndtere 2A/2B-koder.
  2. SIREN/SIRET med Luhn-kontrol — Virksomheds-ID'er forekommer i personlige filer og skaber GDPR-dækkede navnekombinationer.
  3. Fransk NER med fuld accentunderstøttelse — Skal håndtere sammensatte navne (Jean-Pierre), partikler (de, du, des) og accenterede tegn.
  4. Dokumenteret seks-trins-proces — Enhver AI-træningspipeline med franske data kræver en skriftlig registrering af hver anonymiseringsaktivitet.

Kilder

Klar til at beskytte dine data?

Begynd at anonymisere PII med 285+ enhedstyper på tværs af 48 sprog.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.