By · Last updated 2026-06-05

Povratak na BlogGDPR & Usklađenost

CNIL Francuska: Zahtjevi DPA za PII Alate

CNIL je 2023. obradio 16.433 prituzbi (+43%). 63% CNIL obavijesti navodi neadekvatnu AI anonimizaciju. NIR/francuski SSN propusta 78% generickih alata.

June 5, 20269 min čitanja
France CNILNIR French SSNGDPR anonymizationFrench data protectionAI training data

CNIL Francuska: Zahtjevi DPA za PII Alate

Francuski CNIL je najzahtjevnije tijelo za podatke u EU. Vecina EU regulatora pise siroke propise. CNIL ide dalje. Objavljuje precizne tehnicke smjernice zvane recommandations. Te smjernice postavljaju tocne standarde za anonimizaciju i upotrebu podataka u AI sustavima.

CNIL obavijesti 2024. cesto su navodile slabu anonimizaciju u AI sustavima. Agencija je 2023. zaprimila 16.433 prituzbi. To je bilo 43 % vise nego 2022.

CNIL Smjernice Oblikuju EU Politiku

CNIL-ovi tehnicki tekstovi siroko se citiraju od strane ostalih EU DPA-ova. Dva vodicna dokumenta su najvaznija.

Guide pratique de l'anonymisation (2023.): Ovaj vodic pokriva k-anonimnost, l-raznolikost i diferencijalnu privatnost. Pokazuje kako koristiti svaku metodu na francuskim podacima. Svedski IMY i druga EU tijela citiraju ga u vlastitim pravilima.

Smjernice za AI sustave (2024.): CNIL navodi sest vrsta podataka kojima se mora posvetiti paznja u AI treningu. Nijedno drugo EU DPA nije otislo tako daleko u pogledu AI.

Pravila o kolacicima: CNIL-ove smjernice o kolacicima postavljaju najvisi tehnicku ljestvicu za alate pristanka u EU. Redovito se azuriraju.

NIR: Najosjetljiviji Francuski Identifikator

Numero d'Inscription au Repertoire (NIR) - poznat i kao numero de securite sociale - je 15-znamenkasti francuski broj socijalnog osiguranja.

Njegov format je: S AA MM DD CCC OOO K

  • S - 1 znamenka: spol
  • AA - godina rodenja
  • MM - mjesec rodenja
  • DD - departman rodenja (01-95, 2A/2B za Korziku, 97-99 prekomorska podrucja, 99 strani)
  • CCC - kod opcine
  • OOO - redni broj rodenja
  • K - 2-znamenkasti kontrolni kljuc (97 - (NIR mod 97))

NIR sadrzi spol, datum rodenja i mjesto rodenja u jednom broju. CNIL ga tretira kao visokorizican. Zahtijeva istu paznju kao i podaci posebne kategorije prema clanku 9. GDPR-a.

Zasto alati propustaju NIR: Genericki NLP alati ne uspijevaju s NIR-om iz tri razloga. Prvo, 15 znamenki (cesto pisanih bez razmaka) izgledaju kao drugi dugi brojevi. Drugo, znamenke 7-11 sadrze kod departmana. Alati koji preskacu provjeru mod-97 propustaju lazne pozitivne. Trece, korzicki departmani koriste 2A i 2B, a ne ciste znamenke. Alati izgraeni za iskljucivo numericke uzorke ne uspijevaju ovdje.

Dobro otkrivanje NIR-a zahtijeva tri stvari: provjeru mod-97 kljuca, geografski kodnik i pravila svjesna Korzike.

Pogledajte nas pregled sigurnosne uskladjenosti za smjestanje pokrivenosti identifikatora u GDPR sigurnosni okvir.

SIREN i SIRET: Poslovni ID-jevi u Osobnim Datotekama

SIREN: 9-znamenkasti francuski poslovni ID s Luhn kontrolnom znamenkom. Pojavljuje se u svim francuskim poslovnim dokumentima.

SIRET: 14-znamenkasti broj sastavljen od SIREN-a (9 znamenki) plus koda poslovnog mjesta (5 znamenki). SIRET imenuje lokaciju. SIREN imenuje tvrtku.

Poslovne datoteke cesto sadrze SIRET brojeve uz imena zaposlenika. CNIL tretira SIRET plus ime kao osobne podatke. Taj par aktivira GDPR pravila cak i bez zasebnog polja osobnih podataka.

Sest Koraka Anonimizacije za AI Trening

CNIL-ove smjernice za AI iz 2024. pokrivaju sest vrsta podataka. Svaka se mora rijesiti prije upotrebe francuskih osobnih zapisa u AI treningu:

  1. Uklonite izravne identifikatore - Imena, NIR, SIREN moraju biti zamijenjeni ili uklonjeni
  2. Generalizirajte kvazi-identifikatore - Dob, departman i zanimanje mogu se kombinirati za ponovnu identifikaciju; smanjite njihovu preciznost
  3. Dodajte sum brojevima - Numericka polja trebaju kalibrirani sum za blokiranje zakljucivanja
  4. Provjera k-anonimnosti - Svaka osoba mora izgledati kao najmanje k-1 ostalih; CNIL ukazuje na k >= 5
  5. Provjera l-raznolikosti - Osjetljivi atributi moraju varirati unutar svake grupe
  6. Provedite provjeru rizika ponovne identifikacije - Koristite dokumentiranu metodu prije svakog objavljivanja podataka

Samo uklanjanje NIR-a i punog imena nije dovoljno. CNIL je to utvrdio u provedbi. Kvazi-identifikatori poput postasnkog broja i medicinske specijalnosti takoer trebaju obradu.

Nas vodic za GDPR uskladjenost pokriva zapise koje francuske DPA revizije ocekuju.

Jezicni Kontekst za Otkrivanje Francuskog PII

Francuska ima nekoliko lingvistickih konteksta koji utjecu na otkrivanje.

Standardni francuski je jezik svih sluzbenih dokumenata. NER modeli moraju obradivati naglasena slova: e, e, e, e, a, a, i, o, u, c, oe.

Prekomorski teritoriji (DOM-TOM): Martinique, Guadeloupe, Reunion, Guyane i Mayotte koriste NIR kodove u rasponu 97-98. Lokalni uzorci imena razlikuju se od kontinentalne Francuske.

Alsace-Moselle: Njemacka imena i neki njemacki formati dokumenata pojavljuju se u francuskim zapisima. Modeli trenirani iskljucivo na standardnom francuskom mogu propustiti ove.

Prekogranicna upotreba: Belgijski francuski koristi drugaciji format ID-ja. Alati koji se koriste u Francuskoj i Belgiji trebaju pravila za svaki.

Sto Vas Alat Mora Pokriti

Francuska uskladjenost zahtijeva cetiri tehnicke sposobnosti:

  1. NIR s mod-97 provjerom - Samo prepoznavanje uzoraka ne uspijeva. Alati moraju pokretati provjeru kljuca i obradivati 2A/2B kodove.
  2. SIREN/SIRET s Luhn provjerom - Poslovni ID-jevi pojavljuju se u osobnim datotekama i stvaraju kombinacije pokrivene GDPR-om.
  3. Francuski NER s punom podrscom naglasaka - Mora obradivati slozenice (Jean-Pierre), cestice (de, du, des) i naglasena slova.
  4. Dokumentiran sestostupanjski postupak - Svaki AI pipeline koji obraduje francuske podatke treba pisani zapis za svaku aktivnost anonimizacije.

Izvori

Spremni za zaštitu vaših podataka?

Započnite anonimizaciju PII-a s 285+ vrsta entiteta na 48 jezika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.