anonym.legal

By · Last updated 2026-06-05

Povratak na blogGDPR i usklađenost

CNIL Francuska: Tehnicki zahtevi DPA za PII alate

CNIL je obradio 16.433 prituzbe u 2023. (+43%). 63% CNIL nalaza navodi neadekvatnu AI anonimizaciju. NIR/francuski SSN propusten od strane 78% generickih alata.

June 5, 20269 min čitanja
France CNILNIR French SSNGDPR anonymizationFrench data protectionAI training data

CNIL Francuska: Tehnicki zahtevi DPA za PII alate

Francuski CNIL je najzahtevniji organ za zastitu podataka u EU. Vecina EU regulatora pise siroke propise. CNIL ide dalje. Objavljuje precizne tehnicke smernice zvane recommandations. One postavljaju tacne standarde za anonimizaciju i upotrebu podataka u vestackoj inteligenciji.

CNIL nalazi u 2024. cesto su navodili slabu anonimizaciju u AI sistemima. Agencija je primila 16.433 prituzbi u 2023. To je za 43% vise nego u 2022.

CNIL smernice oblikuju EU politiku

CNIL tehnicke tekstove siroko citiraju drugi EU DPA organi. Dva vodicima su najvaznija.

Guide pratique de l'anonymisation (2023): Ovaj vodic pokriva k-anonimnost, l-raznovrsnost i diferencijalnu privatnost. Pokazuje kako koristiti svaku metodu na francuskim podacima. Svedski IMY i drugi EU organi citiraju ga u sopstvenim pravilima.

Smernice za AI sisteme (2024): CNIL navodi sest tipova podataka koji moraju biti tretirani u AI obuci. Nijedan drugi EU DPA organ nije otisao tako daleko u pogledu AI.

Pravila o kolacicima: CNIL-ove smernice o kolacicima postavljaju najvisi tehnicki standard za alate za pristanak u EU. Azuriraju se cesto.

NIR: Najosjetljiviji francuski identifikator

Numero d'Inscription au Repertoire (NIR) - poznat i kao numero de securite sociale - je 15-cifreni francuski broj socijalnog osiguranja.

Njegov format je: S AA MM DD CCC OOO K

  • S - 1 cifra: pol
  • AA - godina rodjenja
  • MM - mesec rodjenja
  • DD - departman rodjenja (01-95, 2A/2B za Korziku, 97-99 prekomorski, 99 strani)
  • CCC - sifra opstine
  • OOO - redni broj rodjenja
  • K - 2-cifreni kontrolni kljuc (97 - (NIR mod 97))

NIR sadrzi pol, datum rodjenja i mesto rodjenja u jednom broju. CNIL ga tretira kao visokorizican. Zahteva istu paznju kao podaci posebnih kategorija prema GDPR clanu 9.

Zasto alati propustaju NIR: Genericki NLP alati ne uspevaju na NIR iz tri razloga. Prvo, 15 cifara (cesto pisanih bez razmaka) lici na druge duge brojeve. Drugo, cifre 7-11 sadrze sifru departmana. Alati koji preskacu mod-97 proveru propustaju lazne pozitivne. Trece, korzicki departmani koriste 2A i 2B, ne ciste cifre. Alati napravljeni za numericke obrasce ne uspevaju ovde.

Dobra NIR detekcija zahteva tri stvari: mod-97 proveru kljuca, geografsku kodnu listu i pravila svesna Korzike.

Pogledjte nas pregled bezbednosne uskladjenosti za to kako pokrivenost identifikatora odgovara skupu GDPR zastita.

SIREN i SIRET: Poslovni ID-jevi u licnim datotekama

SIREN: 9-cifreni francuski ID kompanije sa Luhn kontrolnom cifrom. Pojavljuje se u svim francuskim komercijalnim dokumentima.

SIRET: 14-cifreni broj sacinjen od SIREN (9 cifara) plus sifre lokacije (5 cifara). SIRET imenuje lokaciju. SIREN imenuje kompaniju.

Poslovne datoteke cesto sadrze SIRET brojeve pored imena zaposlenih. CNIL tretira SIRET plus ime kao licne podatke. Taj par aktivira GDPR pravila cak i bez posebnog polja licnih podataka.

Sest koraka anonimizacije za AI obuku

CNIL-ove smernice za AI iz 2024. pokrivaju sest tipova podataka. Svaki mora biti obradjeni pre koriscenja francuskih licnih zapisa u AI obuci:

  1. Ukloniti direktne identifikatore - Imena, NIR, SIREN moraju biti zamenjeni ili uklonjeni
  2. Generalizovati kvaziidentifikatore - Starost, departman, profesija mogu se kombinovati za ponovnu identifikaciju; smanjiti njihovu preciznost
  3. Dodati sum brojevima - Numericka polja zahtevaju kalibrisani sum za blokiranje zakljucaka
  4. Proveriti k-anonimnost - Svaka osoba mora izgledati kao najmanje k-1 osoba; CNIL upucuje na k >= 5
  5. Proveriti l-raznovrsnost - Osjetljivi atributi moraju varirati unutar svake grupe
  6. Sprovesti proveru rizika ponovne identifikacije - Koristiti dokumentovanu metodu pre bilo kakvog objavljivanja podataka

Samo uklanjanje NIR i punog imena nije dovoljno. CNIL je to utvrdio u postupcima primene. Kvaziidentifikatori poput postanskog broja i medicinske specijalnosti takodje zahtevaju tretman.

Nas vodic za GDPR uskladjenost pokriva zapise koje revizije francuskih DPA organa ocekuju da vide.

Jezicki kontekst za detekciju francuskih PII

Francuska ima nekoliko jezickih konteksta koji uticu na detekciju.

Standardni francuski je jezik svih sluzbenih dokumenata. NER modeli moraju obradivati akcente: e, e, e, e, a, a, i, o, u, c, oe.

Prekomorske teritorije (DOM-TOM): Martinik, Gvadelup, Reunion, Gvajana i Majot koriste NIR kodove u opsegu 97-98. Lokalni obrasci imena razlikuju se od metropolitanskog dela Francuske.

Alzas-Mozel: Nemacki nazivi i neki nemacki formati dokumenata pojavljuju se u francuskim zapisima. Modeli trenirani samo na standardnom francuskom mogu propustiti ove.

Prekogranicna upotreba: Belgijski francuski koristi drugacij format ID-ja. Alati koji se koriste u Francuskoj i Belgiji trebaju pravila za svako.

Sta vas alat mora pokriti

Francuska uskladjenost zahteva cetiri tehnicke sposobnosti:

  1. NIR sa mod-97 proverom - Samo podudaranje obrazaca nije dovoljno. Alati moraju pokrenuti proveru kljuca i rukovati kodovima 2A/2B.
  2. SIREN/SIRET sa Luhn proverom - Poslovni ID-jevi pojavljuju se u licnim datotekama i stvaraju kombinacije pokrivene GDPR-om.
  3. Francuski NER sa potpunom podrskon za akcente - Mora rukovati slozenim imenima (Jean-Pierre), cesticama (de, du, des) i naglasenim znakovima.
  4. Dokumentovan sest-koraka proces - Svaki AI pipeline za obuku na francuskim podacima zahteva pisani zapis za svaku aktivnost anonimizacije.

Izvori

Spremni da zaštitite svoje podatke?

Počnite sa anonimizacijom PII sa 285+ tipova entiteta na 48 jezika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.