By · Last updated 2026-06-05

بازگشت به وبلاگGDPR و انطباق

CNIL فرانسه: انطباق فنی با GDPR

CNIL در سال ۲۰۲۳ بیش از ۱۶٬۴۳۳ شکایت را پردازش کرد و از سال ۲۰۱۹ بیش از ۱۵۰ میلیون یورو جریمه صادر کرده. راهنمای هوش مصنوعی آن ناشناس‌سازی مستند برای داده آموزشی را اجباری می‌کند.

June 5, 20267 دقیقه مطالعه
CNIL FranceFrench GDPRAI anonymizationFrench data protectionprivacy by design

CNIL فرانسه: انطباق فنی با GDPR

سخت‌گیرترین مقام حریم خصوصی فرانسه

نهاد داده فرانسه CNIL است. این نهاد دقیق‌ترین قوانین حریم خصوصی اتحادیه اروپا را تعیین می‌کند. بیشتر مقررات‌گذاران اروپایی راهنمایی‌های کلی می‌نویسند. CNIL فراتر می‌رود. مشخصات فنی دقیقی به نام recommandations منتشر می‌کند. این‌ها تعریف می‌کنند که انطباق واقعی با GDPR چه شکلی دارد.

سایر مقررات‌گذاران اروپایی اغلب کار CNIL را کپی می‌کنند. متون کلیدی شامل Guide pratique de l'anonymisation سال ۲۰۲۳ و راهنمای هوش مصنوعی ۲۰۲۴ است.

آمارها نشان می‌دهد که آژانس فعال است. در سال ۲۰۲۳ بیش از ۱۶٬۴۳۳ شکایت را پردازش کرد. این ۴۳٪ بیشتر از ۲۰۲۲ است. از آغاز اجرا حدود ۱۵۰ میلیون یورو جریمه GDPR صادر کرده است.

آموزش هوش مصنوعی: شش نوع سابقه برای پاکسازی

راهنمای هوش مصنوعی CNIL در سال ۲۰۲۴ به‌طور گسترده اعمال می‌شود. هر گروهی که هوش مصنوعی را روی سوابق شخصی فرانسوی آموزش می‌دهد را پوشش می‌دهد. همچنین برای کسانی که با ابزارهای هوش مصنوعی به کاربران فرانسوی خدمت می‌کنند اعمال می‌شود.

آژانس شش نوع سابقه را فهرست می‌کند که قبل از آموزش هوش مصنوعی باید پاکسازی شوند:

  1. Identifiants directs (شناسه‌های مستقیم): نام‌ها، آدرس‌ها، شماره‌های شناسایی. قبل از آموزش این‌ها را حذف یا جایگزین کنید.
  2. Identifiants quasi-directs (شناسه‌های شبه-مستقیم): گروه‌هایی از ویژگی‌ها که امکان شناسایی مجدد را فراهم می‌کنند. بررسی‌های k-anonymity اعمال کنید.
  3. Données sensibles (انواع خاص): سوابق سلامت، بیومتریک، سیاسی و مذهبی. با کنترل‌های اضافه جداسازی کنید.
  4. Données comportementales (سوابق استفاده): تاریخچه مرور و الگوهای استفاده. این‌ها را تجمیع یا ماسک کنید.
  5. Données inférées (ویژگی‌های استنتاج‌شده): سیگنال‌های مشتق‌شده از هوش مصنوعی از استفاده. محدودیت‌های هدف اعمال کنید.
  6. Données relatives aux mineurs (سوابق کودکان): هر سابقه‌ای مرتبط با افراد زیر ۱۵ سال. بررسی سن اجرا کنید و از پاکسازی قوی استفاده کنید.

از LLMهایی که روی محتوای خراشیده آموزش دیده‌اند استفاده می‌کنید؟ نیاز به اثبات مکتوب دارید. نشان دهید که سوابق آموزشی شما مرور و پاکسازی شده. برای جزئیات دامنه به راهنمای انطباق GDPR مراجعه کنید.

راهنمای ناشناس‌سازی: قوانین اصلی

راهنمای ۲۰۲۳ دقیق‌ترین متن اروپا در این موضوع است. معیار آنچه را که واقعاً ناشناس تلقی می‌شود تعیین می‌کند.

تکنیک‌های تأییدشده:

  • k-anonymity — هر سابقه حداقل مثل k-1 سابقه دیگر به نظر می‌رسد
  • l-diversity — ویژگی‌های حساس در هر گروه متغیر هستند
  • Differential privacy — نویز به آمارهای خروجی اضافه می‌شود
  • Pseudonymization — یک گام کاهش ریسک، نه ناشناس‌سازی واقعی

سوابق لازم:

برای هر فعالیتی که از پاکسازی استفاده می‌کند، CNIL یک fiche d'anonymisation (سابقه ناشناس‌سازی) انتظار دارد. باید شامل باشد:

  • تکنیک استفاده‌شده و تنظیمات کلیدی آن (مقدار k، مقدار epsilon)
  • نتیجه بررسی ریسک شناسایی مجدد
  • روش اعتبارسنجی (آزمایش یا بررسی خارجی)
  • مسئول و تاریخ بررسی

بررسی ریسک شناسایی مجدد:

قبل از علامت‌گذاری سوابق به عنوان ناشناس، یک بررسی رسمی انجام دهید. بپرسید: آیا شخص انگیزه‌مند می‌تواند این را شناسایی مجدد کند؟ به مجموعه داده‌های کمکی موجود نگاه کنید. زمینه کامل را در نظر بگیرید.

اطلاعات شخصی فرانسوی: ابزارهای شما باید چه چیزی پیدا کنند

قوانین فرانسوی پوشش اطلاعات شخصی به زبان فرانسوی را الزامی می‌کند. ابزارهای شما باید انواع شناسایی خاص فرانسوی را شناسایی کنند.

شناسه‌های کلیدی برای پوشش:

  • NIR: ۱۵ رقم (۱۳ پایه + کلید ۲ رقمی). این شماره تأمین اجتماعی فرانسوی است.
  • شماره کارت vitale: شناسه کارت بیمه سلامت.
  • SIRET/SIREN: شناسه‌های تجاری که در فایل‌های شخصی یافت می‌شوند.
  • Numéro d'ordre professionnel: شماره‌های ثبت برای پزشکان، وکلا و حسابداران.
  • CNI (Carte nationale d'identité): شماره کارت ملی فرانسوی.

مدل‌های NER فرانسوی باید الگوهای نام فرانسوی را مدیریت کنند. اینها شامل نام‌های مرکب (Jean-Pierre)، ذرات (de، du، des) و نام‌های خانوادگی با خط تیره است. برای نحوه پوشش همه locale‌ها به راهنمای تشخیص اطلاعات شخصی چندزبانه مراجعه کنید.

اجرا: چه چیزهایی جریمه می‌شوند

جریمه‌های آژانس الگوی روشنی دارند. کنترل‌های فنی گم‌شده را هدف می‌گیرند. فرآیند ضعیف به ندرت موضوع اصلی است.

Clearview AI — جریمه ۲۰ میلیون یورو (۲۰۲۲): شرکت سوابق بیومتریک افراد فرانسوی را بدون پایه قانونی پردازش کرد. سوابق از منابع وب عمومی خراشیده شدند. این پرونده تأیید کرد: خراش دسته‌ای از وب برای آموزش هوش مصنوعی نیازمند پایه قانونی صریح است.

TikTok — تحقیق آغازشده ۲۰۲۴: روی سیستم‌هایی متمرکز شد که ممکن است انواع حساس را از سیگنال‌های استفاده استنتاج کنند. این روش اکنون مرجع اروپا برای ممیزی‌های هوش مصنوعی است.

بررسی هوش مصنوعی مولد (۲۰۲۴–۲۰۲۵): آژانس فروشندگان LLM در فرانسه را بررسی کرد. روی منشأ محتوای آموزشی تمرکز داشت. فروشندگانی که سوابق مناسب نداشتند مجبور به اضافه کردن کنترل‌ها شدند.

چهار گام برای انطباق با CNIL

سوابق شخصی فرانسوی را مدیریت می‌کنید؟ باید چهار چیز را داشته باشید.

۱. یک سابقه ناشناس‌سازی برای هر فعالیت

هر فعالیتی که از پاکسازی استفاده می‌کند سابقه خاص خود را نیاز دارد. تکنیک، تنظیمات آن، نتیجه ریسک و تاریخ بررسی را یادداشت کنید.

۲. گزارش‌های پیش‌پردازش برای هوش مصنوعی

ثبت کنید که از کدام ابزار تشخیص اطلاعات شخصی استفاده کردید. یادداشت کنید که چه انواع موجودیتی یافت شد. سابقه‌ای از آنچه حذف یا ماسک شد نگه دارید. این گزارش‌ها را برای ممیزی‌ها آماده داشته باشید.

۳. پوشش اطلاعات شخصی به زبان فرانسوی

بررسی کنید که ابزار شما NIR، carte vitale و شماره‌های CNI را پیدا می‌کند. مدل NER فرانسوی خود را روی نام‌های واقعی فرانسوی آزمایش کنید. هر شکافی را یادداشت کنید. کنترل‌هایی را که برای برطرف کردن آن‌ها گذاشته‌اید ثبت کنید.

۴. سوابق منشأ برای محتوای آموزشی

برای محتوای خراشیده: بررسی پاکسازی منبع را مستند کنید. برای سوابق کاربران: فرآیند پاکسازی کاربران را مستند کنید. مروری بر انطباق امنیتی ما نشان می‌دهد که این چطور در یک پشته محافظتی گسترده‌تر قرار می‌گیرد.

گروه‌هایی با سوابق خوب از ممیزی‌ها سریع‌تر عبور می‌کنند. پرونده خود را الان بسازید. منتظر بازرسی نمانید تا شروع کنید.

منابع

آماده‌اید داده‌های خود را محافظت کنید؟

شروع به ناشناس‌سازی PII با بیش از ۲۸۵ نوع نهاد در ۴۸ زبان.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.