By · Last updated 2026-06-05

Atpakaļ uz BloguGDPR un Atbilstība

CNIL Francija: DPA PII riku prasibas

CNIL 2023. gada apstradata 16 433 sùdzibas (+43%). 63% CNIL paziñojumu atsaucas uz nepietiekamu AI anonimizàciju. NIR/francu sociàlas apdroSinaSanas numuru palaid garâm 78% no vispàrèjiem rikiem.

June 5, 20269 min lasīšanai
France CNILNIR French SSNGDPR anonymizationFrench data protectionAI training data

CNIL Francija: DPA PII riku prasibas

Francijas CNIL ir ES prasìgàkà datu iestàde. Vairums ES regulatoru raksta plaSus noteikumus. CNIL iet tàlàk. Tà publicè precìzus tehniskus norSolumus, kurus sauc recommandations. Tie nosaka precizus standartus anonimizàcijai un AI datu izmantošanai.

CNIL paziñojumos 2024. gadà bieži minèja vàju anonimizàciju AI sistèmàs. Agentura 2023. gadà sanèma 16 433 sùdzibas. Tas bija par 43% vairày nekà 2022. gadà.

CNIL norSolumi veido ES politiku

CNIL tehniskie teksti tiek plaSi citèti citu ES DPA ietvaros. Divi rokasgràmati ir vissvarìgàkàs.

Guide pratique de l'anonymisation (2023): Sìs rokasgramata aptver k-anonimitàti, l-dazàdìbu un diferenciàlo privatumu. Tà paradà, kà izmantot katru metodi uz francu datiem. Zviedrijas IMY un citas ES iestàdes citè to savosnoteikumos.

AI sistèmu norSolumi (2024): CNIL uzrada seSus datu tipus, kas ir japàrvàlda AI apmacibà. Neviens cits ES DPA tik tàlu nav aiziets AI jomà.

Sikdatnu noteikumi: CNIL sikdatnu norSolumi nosaka augstàko tehnikas slieksni piekriSanas rikiem ES. Tà tiek bieži atjauninàta.

NIR: Francijas jutìgàkais identifikators

Numéro d'Inscription au Répertoire (NIR) -- saukts ari par numéro de sécurité sociale -- ir 15 ciparu francu sociàlàs nodroSinàSanas numurs.

Tà formàts ir: S AA MM DD CCC OOO K

  • S -- 1 cipars: dzimums
  • AA -- dzimSanas gads
  • MM -- dzimSanas mènesis
  • DD -- dzimSanas departaments (01-95, 2A/2B Korsikai, 97-99 aizjùras, 99 àrzemnieki)
  • CCC -- pasvaldibas kods
  • OOO -- dzimSanas kàrtiba
  • K -- 2 ciparu pàrbaudes atslega (97 - (NIR mod 97))

NIR satur dzimumu, dzimSanas datumu un dzimSanas vietu vienà numurà. CNIL to uzskata par augsta riska identifikatoru. Tam ir vajadziga tàda pati apstrSade kà ìpaSet kategiorijas datiem saskaña ar VDAR 9. pantu.

Kapèc riki palaid garâm NIR: VispàrèJie NLP riki kLùdàs ar NIR trIs iemeslu dèL. Pirmkàrt, 15 cipari (bieži rakstìti bez atstarpèm) izskata kà citi gari skaitli. Otrkàrt, cipari 7.-11. vietà satur departamenta kodu. Riki, kas izlaiZ mod-97 pàrbaudi, laiZ cauri viltus pozitìvus. TreSàm, Korsijas departamenti izmanto 2A un 2B, ne tìrus ciparus. Riki, kas veidoti tikai skaitliskiem paraugiem, te neiztur.

Lab NIR atklaSanai ir vajadzigs trìs lietas: mod-97 atslègas pàrbaude, geogràfiskà kodexgrâmata un Korsikai pielàgoti noteikumi.

Skatiet musu drosibas atbilstibas parskatu, kà identifikatoru pàrklàjums iederas VDAR aizsardzibas kàrtà.

SIREN un SIRET: uznemumu ID personas failos

SIREN: 9 ciparu francu uznemuma ID ar Luhn pàrbaudes ciparu. ParàdàS visos francu komerciales dokumentos.

SIRET: 14 ciparu numurs, kas veidots no SIREN (9 cipari) plus uznemuma kods (5 cipari). SIRET apzime vietni. SIREN apzime uznemumu.

Uznemumu faili bieži satur SIRET numurus blakus darbinieku vàrdiem. CNIL uzskata SIRET plus vàrds kà personas datus. Sis pàris aktivizè VDAR noteikumus pat bez atseviSKa personas datu lauka.

Sesi anonimizàcijas soLi AI apmacibai

CNIL 2024. gada AI norSolumi aptver Sešus datu tipus. Katrs ir jàapstrào pirms francu personas ierakstu izmantošanas AI apmacibà:

  1. Nodzest tieS os identifikatorus -- Vàrdi, NIR, SIREN ir jàaizvieto vai jàatceLl
  2. VispàrèLt kvazi-identifikatorus -- Vecums, departaments, profesija var kopà atkàrtoti identificèt cilvèkus; samazinàt to precizitàti
  3. Pievienot trokšñus skaitliem -- Skaitliskajiem laukiem ir vajadzigs kalibrèts trokšñis, lai bloKètu datu iegusanu
  4. Pàrbaudìt k-anonimitàti -- Katram cilvèkam ir jabut lìdzigam vismaz k-1 citiem; CNIL norà uz k >= 5
  5. Pàrbaudìt l-dazàdìbu -- Jutìgajiem atributiem ir jàmainàs katrà grupà
  6. Veikt atkàrtotas identifikàcijas riska pàrbaudi -- Izmantot dokumentètu metodi pirms jebkuras datu izlaiSanas

Tikai NIR un pilna vàrda nodzèSana nav pietiekama. CNIL to ir konstatèjis izpildè. Kvazi-identifikatoriem kà pasta indeks un medicìniskà specialitàte ari ir vajadziga apstrSade.

Musu VDAR atbilstibas rokasgramata aptver ierakstus, ko francu DPA auditi sagaida.

Valodas konteksts francu PII atklaSanai

Francijà ir vairaki valodas konteksti, kas ietekme atklaSanu.

Standarta franèu ir visu oficijàlo dokumentu valoda. NER modeLiem ir jasuposta akcentèti burti: é, è, ê, ë, à, â, î, ô, û, ç, œ.

Aizjùras teritorijas (DOM-TOM): Martinikas, Gvadelupes, Reinjona, Gvianas un Majota izmanto NIR kodus 97.-98. diapazonà. Vietèje vàrdu paraugi atSKiras no kontinentàLàs Francijas.

Alzasa-Mozele: Vàcu izcelsmes vàrdi un dazi vàcu dokumentu formàti paradàs francu ierakstos. ModeLi, kas apmacìti tikai uz standarta francu valodu, var palaid Šo garâm.

Pàrrobezu izmantošana: BeL'gijas francu valodà tiek izmantots atSKirigs ID formàts. Riki, kas tiek lietoti Francijà un BeL'gijà, prasa noteikumus abiem.

Kas jùsu rikam ir jàaptver

Francu atbilstiba prasa cetras tehniskàs spèjas:

  1. NIR ar mod-97 pàrbaudi -- Tikai paraugu saskanošana neizdodas. Rikiem ir jàveic atslègas pàrbaude un 2A/2B kodi ir jàapstrSadà.
  2. SIREN/SIRET ar Luhn pàrbaudi -- Uznemumu ID paradàs personas failos un izveido VDAR aptvertos vàrdu kombinàcijas.
  3. Francu NER ar pilnu akcenta atbalstu -- Ir jalaimao salikti vàrdi (Jean-Pierre), partikulas (de, du, des) un akcentèti rakstzìmes.
  4. Dokumentèts sesu soLu process -- Jebkuram AI apmacibas konveijeram uz francu datiem ir vajadzigs rakstisks ieraksts katrai anonimizàcijas aktivitàtei.

Avoti

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.