By · Last updated 2026-06-05

Vissza a BlograGDPR & Megfelelés

CNIL Franciaország: GDPR technikai megfelelőség

A CNIL 16 433 panaszt dolgozott fel 2023-ban, és 2019 óta 150 millió euró feletti bírságot szabott ki. AI-útmutatója dokumentált anonimizálást ír elő a tanítási adatoknál.

June 5, 20267 perc olvasás
CNIL FranceFrench GDPRAI anonymizationFrench data protectionprivacy by design

CNIL Franciaország: GDPR technikai megfelelőség

Franciaország legszigorúbb adatvédelmi szabályozója

Franciaország adatvédelmi testülete a CNIL. Ez állítja fel az EU legpontosabb adatvédelmi szabályait. A legtöbb EU-s szabályozó általános iránymutatást ad. A CNIL tovább megy. Precíz technikai specifikációkat tesz közzé, az úgynevezett recommandations-okat (ajánlásokat). Ezek határozzák meg, mit jelent a valódi GDPR-megfelelőség.

Más EU-s szabályozók gyakran másolják a CNIL munkáját. A legfontosabb dokumentumok a 2023-as Guide pratique de l'anonymisation és a 2024-es AI-útmutatás.

A számok azt mutatják, hogy a testület aktív. 16 433 panaszt kezelt 2023-ban. Ez 43%-kal több, mint 2022-ben. A végrehajtás kezdete óta körülbelül 150 millió eurós GDPR-bírságot szabott ki.

AI-tanítás: Hat megtisztítandó adatkategória

A CNIL 2024-es AI-útmutatása széles körben alkalmazandó. Vonatkozik minden olyan szervezetre, amely francia személyes adatokon tanítja AI-rendszereit. Azokra is vonatkozik, akik AI-eszközökkel szolgálják ki a francia felhasználókat.

A testület hat adatkategóriát sorol fel, amelyeket az AI-tanítás előtt meg kell tisztítani:

  1. Identifiants directs (közvetlen azonosítók): Nevek, címek, azonosítószámok. A tanítás előtt ezeket távolítsa el vagy cserélje ki.
  2. Identifiants quasi-directs (kvázi-azonosítók): Olyan jellemzők csoportjai, amelyek lehetővé teszik az újra-azonosítást. Alkalmazzon k-anonimitás ellenőrzéseket.
  3. Données sensibles (különleges kategóriák): Egészségügyi, biometrikus, politikai és vallási adatok. Különítse el hozzáadott ellenőrzésekkel.
  4. Données comportementales (felhasználói adatok): Böngészési előzmények és használati minták. Ezeket összesítse vagy takarja el.
  5. Données inférées (következtetett jellemzők): Használatból AI által levezetett jelzések. Alkalmazzon célalapú korlátozásokat.
  6. Données relatives aux mineurs (gyermekek adatai): Minden 15 év alatti személlyel kapcsolatos adat. Futtasson korhatár-ellenőrzéseket és alkalmazzon erős megtisztítást.

Nyilvánosan elérhető tartalmakból kinyert LLM-eket használ? Írásos bizonyítékra van szüksége. Mutassa be, hogy a tanítási adatokat átvizsgálták és megtisztították. A hatályt illetően lásd: GDPR-megfelelőségi útmutató.

Az anonimizálási útmutató: alapvető szabályok

A 2023-as útmutató az EU legátfogóbb szövege ebben a témában. Meghatározza, mit jelent a valóban anonimizált állapot.

Elfogadott technikák:

  • k-anonimitás — minden rekord legalább k-1 másikhoz hasonlít
  • l-diverzitás — az érzékeny jellemzők minden csoporton belül változatosak
  • Differenciális adatvédelem — zajt adnak a kimeneti statisztikákhoz
  • Álnevesítés — kockázatcsökkentési lépés, nem valódi anonimizálás

Szükséges nyilvántartások:

Minden anonimizálást alkalmazó tevékenységhez a CNIL egy fiche d'anonymisation (anonimizálási feljegyzés) elkészítését várja. Ennek tartalmaznia kell:

  • Az alkalmazott technikát és főbb beállításait (k-értéke, epsilon-értéke)
  • Az újra-azonosítási kockázat ellenőrzésének eredményét
  • Az érvényesítési módszert (tesztelés vagy külső felülvizsgálat)
  • A felelős személyt és a felülvizsgálat dátumát

Újra-azonosítási kockázat ellenőrzése:

Az adatok anonimnak minősítése előtt végezzen formális ellenőrzést. Tegye fel a kérdést: újra tudna-e azonosítani egy elszánt személy? Vizsgálja meg, milyen kiegészítő adatkészletek léteznek. Vegye figyelembe a teljes körülményt.

Francia személyes adatok: mit kell találnia az eszközének?

A francia szabályok francia nyelvű személyesadat-lefedettséget igényelnek. Az eszközének az alábbi, Franciaország-specifikus azonosítótípusokat kell észlelnie:

Fontosabb észlelendő azonosítók:

  • NIR: 15 jegyű szám (13 alap + 2 jegyű ellenőrzőszám). Ez a francia társadalombiztosítási szám.
  • Carte vitale szám: Egészségbiztosítási kártyaazonosító.
  • SIRET/SIREN: Személyes fájlokban előforduló cégazonosítók.
  • Numéro d'ordre professionnel: Orvosok, jogászok és könyvelők nyilvántartási számai.
  • CNI (Carte nationale d'identité): Francia személyazonosítókártya-szám.

A francia NER-modelleknek kezelniük kell a francia névmintákat. Ezek magukban foglalják az összetett neveket (Jean-Pierre), a névszókat (de, du, des) és a kötőjeles vezetékneveket. Arról, hogyan lehet lefedni az összes területi változatot, lásd: többnyelvű személyiadat-észlelési útmutató.

Végrehajtás: miért szabnak ki bírságot?

A testület bírságai egyértelmű mintát követnek. A hiányzó technikai ellenőrzéseket célozzák meg. A rossz folyamat önmagában ritkán a fő probléma.

Clearview AI — 20 millió eurós bírság (2022): A cég jogi alap nélkül dolgozta fel francia személyek biometrikus adatait. A rekordokat nyilvánosan elérhető webes forrásokból kaparták le. Az ügy megerősítette: az AI-tanításhoz szükséges tömeges webes adatgyűjtés explicit jogalapot igényel.

TikTok — 2024-ben indított vizsgálat: A vizsgálat azokra a rendszerekre összpontosít, amelyek érzékeny kategóriákat következtethetnek ki a felhasználási jelekből. Ez a módszer ma az EU AI-auditjainak referenciája.

Generatív AI-felülvizsgálat (2024–2025): A testület megvizsgálta a franciaországi LLM-szállítókat. A tanítási tartalom eredetére összpontosított. Megfelelő nyilvántartásokkal nem rendelkező szállítóknak ellenőrzéseket kellett hozzáadniuk.

Négy lépés a CNIL-megfelelőséghez

Francia személyes adatokat kezel? Négy dolognak kell a helyén lennie.

1. Anonimizálási feljegyzés minden tevékenységhez

Minden anonimizálást alkalmazó tevékenységhez saját feljegyzés szükséges. Tüntesse fel a technikát, annak beállításait, egy kockázati eredményt és egy felülvizsgálati dátumot.

2. Előfeldolgozási naplók az AI-hoz

Naplózza, melyik személyiadat-észlelő eszközt használta. Jegyezze fel, milyen entitástípusokat talált. Rögzítse, mi lett eltávolítva vagy elfedve. Tartsa készen ezeket a naplókat az auditokhoz.

3. Francia nyelvű személyesadat-lefedettség

Ellenőrizze, hogy az eszköze megtalálja-e az NIR-t, a carte vitale-t és a CNI-számokat. Tesztelje a francia NER-modellt valódi francia neveken. Jegyezze fel a hiányosságokat. Rögzítse az azok kezelésére bevezetett ellenőrzéseket.

4. Proveniencia-nyilvántartások a tanítási tartalomhoz

Kigyűjtött tartalomhoz: dokumentálja a forrás-megtisztítási ellenőrzést. Felhasználói adatokhoz: dokumentálja a felhasználói megtisztítási folyamatot. A biztonsági megfelelőségi áttekintőnk megmutatja, hogyan illeszkedik ez a szélesebb védelmi keretrendszerbe.

Azok a szervezetek, amelyek jó nyilvántartásokkal rendelkeznek, gyorsan átmennek az auditokon. Készítse el a dossziéját most. Ne várja meg az ellenőrzést.

Források

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.