anonym.legal

By · Last updated 2026-06-05

กลับไปที่บล็อกGDPR & การปฏิบัติตาม

CNIL ฝรั่งเศส: การปฏิบัติตาม GDPR ทางเทคนิค

CNIL ประมวลผลข้อร้องเรียน 16,433 รายการในปี 2023 และออกค่าปรับมากกว่า 150 ล้านยูโรตั้งแต่ปี 2019 แนวทาง AI ของหน่วยงานกำหนดให้มีการทำให้ไม่ระบุตัวตนที่มีเอกสารประกอบสำหรับข้อมูลการฝึก

June 5, 20267 อ่านประมาณ
CNIL FranceFrench GDPRAI anonymizationFrench data protectionprivacy by design

CNIL ฝรั่งเศส: การปฏิบัติตาม GDPR ทางเทคนิค

หน่วยงานกำกับดูแลความเป็นส่วนตัวที่เข้มงวดที่สุดของฝรั่งเศส

หน่วยงานด้านข้อมูลของฝรั่งเศสคือ CNIL กำหนดกฎความเป็นส่วนตัวที่แม่นยำที่สุดใน EU หน่วยงานกำกับดูแล EU ส่วนใหญ่เขียนแนวทางที่กว้าง CNIL ไปไกลกว่านั้น เผยแพร่ข้อกำหนดทางเทคนิคที่แม่นยำที่เรียกว่า recommandations ซึ่งกำหนดความหมายของการปฏิบัติตาม GDPR อย่างแท้จริง

หน่วยงานกำกับดูแล EU อื่นๆ มักคัดลอกงานของ CNIL ตำราสำคัญได้แก่ Guide pratique de l'anonymisation ปี 2023 และแนวทาง AI ปี 2024

ตัวเลขแสดงให้เห็นว่าหน่วยงานนี้มีความกระตือรือร้น รับข้อร้องเรียน 16,433 รายการในปี 2023 มากกว่าปี 2022 ถึง 43% ออกค่าปรับ GDPR ประมาณ 150 ล้านยูโรตั้งแต่เริ่มบังคับใช้

การฝึก AI: ประเภทบันทึก 6 ประเภทที่ต้องทำความสะอาด

แนวทาง AI ปี 2024 ของ CNIL ใช้บังคับอย่างกว้างขวาง ครอบคลุมกลุ่มใดก็ตามที่ฝึก AI บนบันทึกส่วนบุคคลของฝรั่งเศส และยังใช้กับผู้ที่ให้บริการผู้ใช้ชาวฝรั่งเศสด้วยเครื่องมือ AI

หน่วยงานระบุประเภทบันทึก 6 ประเภทที่ต้องทำความสะอาดก่อนการฝึก AI:

  1. Identifiants directs (ID โดยตรง): ชื่อ ที่อยู่ หมายเลข ID ลบหรือแทนที่สิ่งเหล่านี้ก่อนการฝึก
  2. Identifiants quasi-directs (quasi-ID): กลุ่มของลักษณะที่อนุญาตให้ระบุตัวตนใหม่ ใช้การตรวจสอบ k-anonymity
  3. Données sensibles (ประเภทพิเศษ): บันทึกด้านสุขภาพ ไบโอเมตริก การเมือง และศาสนา แยกออกด้วยการควบคุมเพิ่มเติม
  4. Données comportementales (บันทึกการใช้งาน): ประวัติการเรียกดูและรูปแบบการใช้งาน รวมกลุ่มหรือปิดบังข้อมูลเหล่านี้
  5. Données inférées (ลักษณะที่อนุมาน): สัญญาณที่ AI ได้รับจากการใช้งาน ใช้ขีดจำกัดวัตถุประสงค์
  6. Données relatives aux mineurs (บันทึกของเด็ก): บันทึกใดก็ตามที่เชื่อมโยงกับบุคคลอายุต่ำกว่า 15 ปี ตรวจสอบอายุและใช้การทำความสะอาดที่เข้มแข็ง

ใช้ LLM ที่ฝึกบนเนื้อหาที่ขูดข้อมูลมา? คุณต้องมีหลักฐานเป็นลายลักษณ์อักษร แสดงให้เห็นว่าบันทึกการฝึกของคุณได้รับการตรวจสอบและทำความสะอาด ดู คู่มือการปฏิบัติตาม GDPR สำหรับรายละเอียดขอบเขต

คู่มือการทำให้ไม่ระบุตัวตน: กฎหลัก

คู่มือปี 2023 เป็นตำราที่ละเอียดที่สุดใน EU ในหัวข้อนี้ กำหนดมาตรฐานว่าอะไรถือว่าไม่ระบุตัวตนอย่างแท้จริง

เทคนิคที่ได้รับการอนุมัติ:

  • k-anonymity — แต่ละบันทึกดูเหมือนกับอีกอย่างน้อย k-1 บันทึก
  • l-diversity — ลักษณะที่ละเอียดอ่อนแตกต่างกันภายในแต่ละกลุ่ม
  • Differential privacy — เพิ่ม noise ให้กับสถิติผลลัพธ์
  • Pseudonymization — ขั้นตอนการลดความเสี่ยง ไม่ใช่การทำให้ไม่ระบุตัวตนอย่างแท้จริง

บันทึกที่จำเป็น:

สำหรับแต่ละกิจกรรมที่ใช้การทำความสะอาด CNIL คาดหวัง fiche d'anonymisation (บันทึกการทำให้ไม่ระบุตัวตน) ต้องรวมถึง:

  • เทคนิคที่ใช้และการตั้งค่าหลัก (ค่า k, ค่า epsilon)
  • ผลการตรวจสอบความเสี่ยงในการระบุตัวตนใหม่
  • วิธีการตรวจสอบ (การทดสอบหรือการตรวจสอบภายนอก)
  • บุคคลที่รับผิดชอบและวันที่ตรวจสอบ

การตรวจสอบความเสี่ยงในการระบุตัวตนใหม่:

ก่อนที่จะทำเครื่องหมายบันทึกว่าไม่ระบุตัวตน ให้ทำการตรวจสอบอย่างเป็นทางการ ถามว่า: บุคคลที่มีแรงจูงใจสามารถระบุตัวตนใหม่ได้หรือไม่? ดูว่ามีชุดข้อมูลเสริมอะไรบ้าง พิจารณาบริบทเต็มรูปแบบ

PII ภาษาฝรั่งเศส: สิ่งที่เครื่องมือของคุณต้องค้นหา

กฎของฝรั่งเศสกำหนดให้ต้องครอบคลุม PII ภาษาฝรั่งเศส เครื่องมือของคุณต้องตรวจจับประเภท ID เฉพาะของฝรั่งเศส

ID หลักที่ต้องครอบคลุม:

  • NIR: 15 หลัก (13 ฐาน + คีย์ 2 หลัก) นี่คือหมายเลขประกันสังคมของฝรั่งเศส
  • หมายเลขบัตร Carte vitale: ID บัตรประกันสุขภาพ
  • SIRET/SIREN: ID ธุรกิจที่พบในไฟล์ส่วนตัว
  • Numéro d'ordre professionnel: หมายเลขทะเบียนสำหรับแพทย์ ทนายความ และนักบัญชี
  • CNI (Carte nationale d'identité): หมายเลขบัตรประจำตัวประชาชนแห่งชาติของฝรั่งเศส

โมเดล NER ภาษาฝรั่งเศสต้องจัดการกับรูปแบบชื่อฝรั่งเศส ซึ่งรวมถึงชื่อประสม (Jean-Pierre) อนุภาค (de, du, des) และนามสกุลที่มีขีดกลาง ดู คู่มือการตรวจจับ PII หลายภาษา เพื่อดูวิธีครอบคลุมทุก locale

การบังคับใช้: สิ่งที่ถูกปรับ

ค่าปรับของหน่วยงานดำเนินตามรูปแบบที่ชัดเจน มุ่งเป้าไปที่การควบคุมทางเทคนิคที่ขาดหายไป กระบวนการที่ไม่ดีเพียงอย่างเดียวแทบไม่ใช่ประเด็นหลัก

Clearview AI — ค่าปรับ 20 ล้านยูโร (2022): บริษัทประมวลผลบันทึกไบโอเมตริกของชาวฝรั่งเศสโดยไม่มีพื้นฐานทางกฎหมาย บันทึกถูกขูดจากแหล่งเว็บสาธารณะ คดีนี้ยืนยัน: การขูดข้อมูลเว็บจำนวนมากสำหรับการฝึก AI ต้องการพื้นฐานทางกฎหมายที่ชัดเจน

TikTok — เริ่มสอบสวนปี 2024: มุ่งเน้นไปที่ระบบที่อาจอนุมานประเภทที่ละเอียดอ่อนจากสัญญาณการใช้งาน วิธีนี้กลายเป็นมาตรฐานอ้างอิง EU สำหรับการตรวจสอบ AI

การตรวจสอบ Generative AI (2024–2025): หน่วยงานตรวจสอบผู้ขาย LLM ในฝรั่งเศส มุ่งเน้นไปที่แหล่งที่มาของเนื้อหาการฝึก ผู้ขายที่ไม่มีบันทึกที่เหมาะสมต้องเพิ่มการควบคุม

สี่ขั้นตอนสู่การปฏิบัติตาม CNIL

จัดการบันทึกส่วนบุคคลของฝรั่งเศส? คุณต้องมีสี่สิ่งนี้ในสถานที่

1. บันทึกการทำให้ไม่ระบุตัวตนสำหรับแต่ละกิจกรรม

แต่ละกิจกรรมที่ใช้การทำความสะอาดต้องมีบันทึกของตัวเอง ระบุเทคนิค การตั้งค่า ผลความเสี่ยง และวันที่ตรวจสอบ

2. บันทึกการประมวลผลล่วงหน้าสำหรับ AI

บันทึกว่าคุณใช้เครื่องมือตรวจจับ PII อะไร ระบุประเภท entity ที่พบ บันทึกสิ่งที่ถูกลบหรือปิดบัง เก็บบันทึกเหล่านี้พร้อมสำหรับการตรวจสอบ

3. ความครอบคลุม PII ภาษาฝรั่งเศส

ตรวจสอบว่าเครื่องมือของคุณค้นหาหมายเลข NIR, carte vitale และ CNI ทดสอบโมเดล NER ภาษาฝรั่งเศสของคุณกับชื่อฝรั่งเศสจริง ระบุช่องว่าง บันทึกการควบคุมที่คุณกำหนดเพื่อแก้ไขปัญหา

4. บันทึกแหล่งที่มาสำหรับเนื้อหาการฝึก

สำหรับเนื้อหาที่ขูดมา: บันทึกการตรวจสอบการทำความสะอาดแหล่งที่มา สำหรับบันทึกผู้ใช้: บันทึกกระบวนการทำความสะอาดผู้ใช้ ภาพรวมการปฏิบัติตามความปลอดภัย ของเราแสดงให้เห็นว่าสิ่งนี้เหมาะกับโครงสร้างการป้องกันที่กว้างขึ้นอย่างไร

กลุ่มที่มีบันทึกที่ดีผ่านการตรวจสอบได้เร็ว สร้างไฟล์ของคุณตอนนี้ อย่ารอให้มีการตรวจสอบก่อนถึงจะเริ่ม

แหล่งข้อมูล

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

เริ่มทำให้ PII เป็นนิรนามด้วยประเภทเอนทิตีมากกว่า 285 ประเภทใน 48 ภาษา.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.