سخت‌گیرترین مقام حریم خصوصی فرانسه

نهاد داده فرانسه CNIL است. این نهاد دقیق‌ترین قوانین حریم خصوصی اتحادیه اروپا را تعیین می‌کند. بیشتر مقررات‌گذاران اروپایی راهنمایی‌های کلی می‌نویسند. CNIL فراتر می‌رود. مشخصات فنی دقیقی به نام recommandations منتشر می‌کند. این‌ها تعریف می‌کنند که انطباق واقعی با GDPR چه شکلی دارد.

سایر مقررات‌گذاران اروپایی اغلب کار CNIL را کپی می‌کنند. متون کلیدی شامل Guide pratique de l'anonymisation سال ۲۰۲۳ و راهنمای هوش مصنوعی ۲۰۲۴ است.

آمارها نشان می‌دهد که آژانس فعال است. در سال ۲۰۲۳ بیش از ۱۶٬۴۳۳ شکایت را پردازش کرد. این ۴۳٪ بیشتر از ۲۰۲۲ است. از آغاز اجرا حدود ۱۵۰ میلیون یورو جریمه GDPR صادر کرده است.

آموزش هوش مصنوعی: شش نوع سابقه برای پاکسازی

راهنمای هوش مصنوعی CNIL در سال ۲۰۲۴ به‌طور گسترده اعمال می‌شود. هر گروهی که هوش مصنوعی را روی سوابق شخصی فرانسوی آموزش می‌دهد را پوشش می‌دهد. همچنین برای کسانی که با ابزارهای هوش مصنوعی به کاربران فرانسوی خدمت می‌کنند اعمال می‌شود.

آژانس شش نوع سابقه را فهرست می‌کند که قبل از آموزش هوش مصنوعی باید پاکسازی شوند:

Identifiants directs (شناسه‌های مستقیم): نام‌ها، آدرس‌ها، شماره‌های شناسایی. قبل از آموزش این‌ها را حذف یا جایگزین کنید.
Identifiants quasi-directs (شناسه‌های شبه-مستقیم): گروه‌هایی از ویژگی‌ها که امکان شناسایی مجدد را فراهم می‌کنند. بررسی‌های k-anonymity اعمال کنید.
Données sensibles (انواع خاص): سوابق سلامت، بیومتریک، سیاسی و مذهبی. با کنترل‌های اضافه جداسازی کنید.
Données comportementales (سوابق استفاده): تاریخچه مرور و الگوهای استفاده. این‌ها را تجمیع یا ماسک کنید.
Données inférées (ویژگی‌های استنتاج‌شده): سیگنال‌های مشتق‌شده از هوش مصنوعی از استفاده. محدودیت‌های هدف اعمال کنید.
Données relatives aux mineurs (سوابق کودکان): هر سابقه‌ای مرتبط با افراد زیر ۱۵ سال. بررسی سن اجرا کنید و از پاکسازی قوی استفاده کنید.

از LLMهایی که روی محتوای خراشیده آموزش دیده‌اند استفاده می‌کنید؟ نیاز به اثبات مکتوب دارید. نشان دهید که سوابق آموزشی شما مرور و پاکسازی شده. برای جزئیات دامنه به راهنمای انطباق GDPR مراجعه کنید.

راهنمای ناشناس‌سازی: قوانین اصلی

راهنمای ۲۰۲۳ دقیق‌ترین متن اروپا در این موضوع است. معیار آنچه را که واقعاً ناشناس تلقی می‌شود تعیین می‌کند.

تکنیک‌های تأییدشده:

k-anonymity — هر سابقه حداقل مثل k-1 سابقه دیگر به نظر می‌رسد
l-diversity — ویژگی‌های حساس در هر گروه متغیر هستند
Differential privacy — نویز به آمارهای خروجی اضافه می‌شود
Pseudonymization — یک گام کاهش ریسک، نه ناشناس‌سازی واقعی

سوابق لازم:

برای هر فعالیتی که از پاکسازی استفاده می‌کند، CNIL یک fiche d'anonymisation (سابقه ناشناس‌سازی) انتظار دارد. باید شامل باشد:

تکنیک استفاده‌شده و تنظیمات کلیدی آن (مقدار k، مقدار epsilon)
نتیجه بررسی ریسک شناسایی مجدد
روش اعتبارسنجی (آزمایش یا بررسی خارجی)
مسئول و تاریخ بررسی

بررسی ریسک شناسایی مجدد:

قبل از علامت‌گذاری سوابق به عنوان ناشناس، یک بررسی رسمی انجام دهید. بپرسید: آیا شخص انگیزه‌مند می‌تواند این را شناسایی مجدد کند؟ به مجموعه داده‌های کمکی موجود نگاه کنید. زمینه کامل را در نظر بگیرید.

اطلاعات شخصی فرانسوی: ابزارهای شما باید چه چیزی پیدا کنند

قوانین فرانسوی پوشش اطلاعات شخصی به زبان فرانسوی را الزامی می‌کند. ابزارهای شما باید انواع شناسایی خاص فرانسوی را شناسایی کنند.

شناسه‌های کلیدی برای پوشش:

NIR: ۱۵ رقم (۱۳ پایه + کلید ۲ رقمی). این شماره تأمین اجتماعی فرانسوی است.
شماره کارت vitale: شناسه کارت بیمه سلامت.
SIRET/SIREN: شناسه‌های تجاری که در فایل‌های شخصی یافت می‌شوند.
Numéro d'ordre professionnel: شماره‌های ثبت برای پزشکان، وکلا و حسابداران.
CNI (Carte nationale d'identité): شماره کارت ملی فرانسوی.

مدل‌های NER فرانسوی باید الگوهای نام فرانسوی را مدیریت کنند. اینها شامل نام‌های مرکب (Jean-Pierre)، ذرات (de، du، des) و نام‌های خانوادگی با خط تیره است. برای نحوه پوشش همه locale‌ها به راهنمای تشخیص اطلاعات شخصی چندزبانه مراجعه کنید.

اجرا: چه چیزهایی جریمه می‌شوند

جریمه‌های آژانس الگوی روشنی دارند. کنترل‌های فنی گم‌شده را هدف می‌گیرند. فرآیند ضعیف به ندرت موضوع اصلی است.

Clearview AI — جریمه ۲۰ میلیون یورو (۲۰۲۲): شرکت سوابق بیومتریک افراد فرانسوی را بدون پایه قانونی پردازش کرد. سوابق از منابع وب عمومی خراشیده شدند. این پرونده تأیید کرد: خراش دسته‌ای از وب برای آموزش هوش مصنوعی نیازمند پایه قانونی صریح است.

TikTok — تحقیق آغازشده ۲۰۲۴: روی سیستم‌هایی متمرکز شد که ممکن است انواع حساس را از سیگنال‌های استفاده استنتاج کنند. این روش اکنون مرجع اروپا برای ممیزی‌های هوش مصنوعی است.

بررسی هوش مصنوعی مولد (۲۰۲۴–۲۰۲۵): آژانس فروشندگان LLM در فرانسه را بررسی کرد. روی منشأ محتوای آموزشی تمرکز داشت. فروشندگانی که سوابق مناسب نداشتند مجبور به اضافه کردن کنترل‌ها شدند.

چهار گام برای انطباق با CNIL

سوابق شخصی فرانسوی را مدیریت می‌کنید؟ باید چهار چیز را داشته باشید.

۱. یک سابقه ناشناس‌سازی برای هر فعالیت

هر فعالیتی که از پاکسازی استفاده می‌کند سابقه خاص خود را نیاز دارد. تکنیک، تنظیمات آن، نتیجه ریسک و تاریخ بررسی را یادداشت کنید.

۲. گزارش‌های پیش‌پردازش برای هوش مصنوعی

ثبت کنید که از کدام ابزار تشخیص اطلاعات شخصی استفاده کردید. یادداشت کنید که چه انواع موجودیتی یافت شد. سابقه‌ای از آنچه حذف یا ماسک شد نگه دارید. این گزارش‌ها را برای ممیزی‌ها آماده داشته باشید.

۳. پوشش اطلاعات شخصی به زبان فرانسوی

بررسی کنید که ابزار شما NIR، carte vitale و شماره‌های CNI را پیدا می‌کند. مدل NER فرانسوی خود را روی نام‌های واقعی فرانسوی آزمایش کنید. هر شکافی را یادداشت کنید. کنترل‌هایی را که برای برطرف کردن آن‌ها گذاشته‌اید ثبت کنید.

۴. سوابق منشأ برای محتوای آموزشی

برای محتوای خراشیده: بررسی پاکسازی منبع را مستند کنید. برای سوابق کاربران: فرآیند پاکسازی کاربران را مستند کنید. مروری بر انطباق امنیتی ما نشان می‌دهد که این چطور در یک پشته محافظتی گسترده‌تر قرار می‌گیرد.

گروه‌هایی با سوابق خوب از ممیزی‌ها سریع‌تر عبور می‌کنند. پرونده خود را الان بسازید. منتظر بازرسی نمانید تا شروع کنید.

منابع

مقالات مرتبط

GDPR و انطباق

آماده‌اید داده‌های خود را محافظت کنید؟

شروع به ناشناس‌سازی PII با بیش از ۲۸۵ نوع نهاد در ۴۸ زبان.

آغاز دوره آزمایشی رایگان مشاهده ویژگی‌ها

CNIL فرانسه: انطباق فنی با GDPR