By · Last updated 2026-06-05

חזרה לבלוגGDPR ועמידה

CNIL צרפת: ציות GDPR טכני

CNIL עיבד 16,433 תלונות ב-2023 וקנס ב-150 מיליון אירו+ מאז 2019. הנחיית הבינה המלאכותית שלה מחייבת אנונימיזציה מתועדת לנתוני אימון.

June 5, 20267 דקות קריאה
CNIL FranceFrench GDPRAI anonymizationFrench data protectionprivacy by design

CNIL צרפת: ציות GDPR טכני

הרגולטור הפרטיות המחמיר ביותר של צרפת

גוף הנתונים של צרפת הוא CNIL. הוא קובע את כללי הפרטיות המדויקים ביותר באיחוד האירופי. רוב הרגולטורים האירופאיים כותבים הנחיות רחבות. CNIL הולך רחוק יותר. הוא מפרסם מפרטים טכניים מדויקים הנקראים recommandations. אלו מגדירים כיצד נראה ציות GDPR אמיתי.

רגולטורים אירופאיים אחרים לעתים קרובות מעתיקים את עבודת CNIL. טקסטים מרכזיים כוללים את Guide pratique de l'anonymisation משנת 2023 והנחיית הבינה המלאכותית משנת 2024.

המספרים מראים שהסוכנות פעילה. היא טיפלה ב-16,433 תלונות ב-2023. זה 43% יותר מ-2022. היא הנפיקה כ-150 מיליון אירו בקנסות GDPR מאז תחילת האכיפה.

אימון בינה מלאכותית: שישה סוגי רשומות לניקוי

הנחיית הבינה המלאכותית של CNIL משנת 2024 חלה בהיקף רחב. היא מכסה כל קבוצה שמאמנת בינה מלאכותית על רשומות אישיות צרפתיות. היא חלה גם על מי שמשרת משתמשים צרפתים עם כלי בינה מלאכותית.

הסוכנות מפרטת שישה סוגי רשומות שדורשים ניקוי לפני אימון בינה מלאכותית:

  1. Identifiants directs (מזהים ישירים): שמות, כתובות, מספרי זהות. הסירו או החליפו אלה לפני האימון.
  2. Identifiants quasi-directs (מזהים כמו-ישירים): קבוצות של מאפיינים המאפשרים זיהוי מחדש. יישמו בדיקות k-anonymity.
  3. Données sensibles (סוגים מיוחדים): רשומות בריאות, ביומטריות, פוליטיות ואמוניות. בודדו עם בקרות נוספות.
  4. Données comportementales (רשומות שימוש): היסטוריית גלישה ודפוסי שימוש. צברו או מסכו אלה.
  5. Données inférées (מאפיינים מוסקים): אותות מבינה מלאכותית מהשימוש. יישמו גבולות מטרה.
  6. Données relatives aux mineurs (רשומות ילדים): כל רשומות הקשורות לאנשים מתחת לגיל 15. הריצו בדיקות גיל והשתמשו בניקוי חזק.

משתמשים ב-LLM שאומנו על תוכן שנגרד? אתם זקוקים להוכחה כתובה. הראו שרשומות האימון שלכם נסקרו ונוקו. ראו את מדריך הציות ל-GDPR שלנו לפרטי ההיקף.

מדריך האנונימיזציה: כללים מרכזיים

המדריך משנת 2023 הוא הטקסט המפורט ביותר של האיחוד האירופי בנושא זה. הוא קובע את הסטנדרט למה שנחשב באמת אנונימי.

טכניקות מאושרות:

  • k-anonymity — כל רשומה נראית כמו לפחות k-1 רשומות אחרות
  • l-diversity — מאפיינים רגישים משתנים בתוך כל קבוצה
  • פרטיות דיפרנציאלית — רעש מתווסף לסטטיסטיקות הפלט
  • פסבדואנימיזציה — שלב להפחתת סיכון, לא אנונימיזציה אמיתית

רשומות נדרשות:

לכל פעילות המשתמשת בניקוי, CNIL מצפה ל-fiche d'anonymisation (רשומת אנונימיזציה). היא חייבת לכלול:

  • הטכניקה שנעשה בה שימוש והגדרותיה המרכזיות (ערך k, ערך epsilon)
  • תוצאת בדיקת סיכון זיהוי מחדש
  • שיטת האימות (בדיקה או סקירה חיצונית)
  • האחראי ותאריך הסקירה

בדיקת סיכון זיהוי מחדש:

לפני סימון רשומות כאנונימיות, הריצו בדיקה פורמלית. שאלו: האם אדם בעל מוטיבציה יכול לזהות מחדש? בדקו אילו מסדי נתונים עזר קיימים. שקלו את ההקשר המלא.

PII צרפתי: מה הכלים שלכם חייבים למצוא

הכללים הצרפתיים דורשים כיסוי PII בצרפתית. הכלים שלכם חייבים לזהות סוגי זהות ספציפיים לצרפת.

מזהים מרכזיים לכסות:

  • NIR: 15 ספרות (13 בסיס + מפתח דו-ספרתי). זהו מספר הביטוח הלאומי הצרפתי.
  • מספר carte vitale: מזהה כרטיס ביטוח הבריאות.
  • SIRET/SIREN: מזהים עסקיים המופיעים בקבצים אישיים.
  • Numéro d'ordre professionnel: מספרי רישום לרופאים, עורכי דין ורואי חשבון.
  • CNI (Carte nationale d'identité): מספר כרטיס הזהות הלאומי הצרפתי.

מודלי NER צרפתיים חייבים לטפל בדפוסי שמות צרפתיים. אלה כוללים שמות מורכבים (Jean-Pierre), חלקיקים (de, du, des) ושמות משפחה בנחתים. ראו את מדריך הזיהוי הרב-לשוני של PII שלנו לאופן בו לכסות את כל האזורים.

אכיפה: מה מקבל קנסות

הקנסות של הסוכנות עוקבים אחרי דפוס ברור. הם מכוונים לבקרות טכניות חסרות. תהליך לקוי לבדו נדיר שיהיה הסוגיה המרכזית.

Clearview AI — קנס של 20 מיליון אירו (2022): החברה עיבדה רשומות ביומטריות של צרפתים ללא בסיס משפטי. הרשומות נגרדו ממקורות אינטרנט ציבוריים. המקרה אישר: גרידה ברשת בכמות גדולה לאימון בינה מלאכותית דורשת בסיס משפטי מפורש.

TikTok — חקירה שנפתחה 2024: התמקדה במערכות שעשויות להסיק סוגים רגישים מאותות שימוש. שיטה זו היא כעת ההפניה האירופאית לביקורות בינה מלאכותית.

סקירת בינה מלאכותית גנרטיבית (2024-2025): הסוכנות סקרה ספקי LLM בצרפת. התמקדה במקור תוכן האימון. ספקים ללא רשומות תקינות נאלצו להוסיף בקרות.

ארבעה צעדים לציות CNIL

מטפלים ברשומות אישיות צרפתיות? אתם זקוקים לארבעה דברים.

1. רשומת אנונימיזציה לכל פעילות

כל פעילות המשתמשת בניקוי זקוקה לרשומה משלה. ציינו את הטכניקה, הגדרותיה, תוצאת סיכון ותאריך סקירה.

2. יומני עיבוד מקדים לבינה מלאכותית

רשמו איזה כלי זיהוי PII השתמשתם בו. ציינו אילו סוגי ישויות הוא מצא. תעדו מה הוסר או נוסה. שמרו יומנים אלו מוכנים לביקורות.

3. כיסוי PII בצרפתית

וודאו שהכלי שלכם מוצא מספרי NIR, carte vitale ו-CNI. בדקו את מודל ה-NER הצרפתי שלכם על שמות צרפתיים אמיתיים. ציינו פערים כלשהם. תעדו את הבקרות שהכנסתם לטפל בהם.

4. רשומות מקור לתוכן אימון

לתוכן גרוד: תעדו את בדיקת ניקוי המקור. לרשומות משתמשים: תעדו את תהליך ניקוי המשתמש. סקירת ציות האבטחה שלנו מראה כיצד זה מתאים לערימת הגנה רחבה יותר.

קבוצות עם רשומות טובות עוברות ביקורות מהר. בנו את הקובץ שלכם עכשיו. אל תחכו לפיקוח כדי להתחיל.

מקורות

מוכן להגן על הנתונים שלך?

התחל לאנונימיזציה של PII עם 285+ סוגי ישויות ב-48 שפות.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.