anonym.legal

By · Last updated 2026-06-05

กลับไปที่บล็อกGDPR & การปฏิบัติตาม

CNIL ฝรั่งเศส: ข้อกำหนดเครื่องมือ PII ของ DPA

CNIL รับเรื่องร้องเรียน 16,433 รายในปี 2023 (+43%) 63% ของประกาศ CNIL อ้างถึงการทำให้นิรนาม AI ไม่เพียงพอ NIR/French SSN ถูกตรวจจับพลาดโดยเครื่องมือทั่วไป 78%

June 5, 20269 อ่านประมาณ
France CNILNIR French SSNGDPR anonymizationFrench data protectionAI training data

CNIL ฝรั่งเศส: ข้อกำหนดเครื่องมือ PII ของ DPA

CNIL ของฝรั่งเศสเป็นหน่วยงานข้อมูลที่เรียกร้องมากที่สุดใน EU หน่วยงานกำกับดูแล EU ส่วนใหญ่เขียนกฎกว้างๆ แต่ CNIL ไปไกลกว่านั้น โดยเผยแพร่แนวทางทางเทคนิคที่แม่นยำที่เรียกว่า recommandations ซึ่งกำหนดมาตรฐานที่แน่นอนสำหรับการทำให้นิรนามและการใช้ข้อมูล AI

ประกาศของ CNIL ในปี 2024 มักอ้างถึงการทำให้นิรนามที่อ่อนแอในระบบ AI หน่วยงานรับเรื่องร้องเรียน 16,433 รายในปี 2023 เพิ่มขึ้น 43% จากปี 2022

แนวทาง CNIL กำหนดนโยบาย EU

ข้อความทางเทคนิคของ CNIL ถูกอ้างอิงอย่างกว้างขวางโดย DPA อื่นๆ ของ EU มีสองคู่มือที่สำคัญที่สุด

Guide pratique de l'anonymisation (2023): คู่มือนี้ครอบคลุม k-anonymity, l-diversity และ differential privacy โดยแสดงวิธีใช้แต่ละวิธีกับข้อมูลฝรั่งเศส IMY ของสวีเดนและหน่วยงาน EU อื่นๆ อ้างอิงในกฎของตนเอง

แนวทางระบบ AI (2024): CNIL แสดงรายการข้อมูลหกประเภทที่ต้องจัดการในการฝึก AI ไม่มี DPA อื่นใน EU ที่ก้าวไกลเช่นนี้ในด้าน AI

กฎ cookie: แนวทาง cookie ของ CNIL กำหนดมาตรฐานทางเทคนิคสูงสุดสำหรับเครื่องมือความยินยอมใน EU และได้รับการอัปเดตบ่อยครั้ง

NIR: ตัวระบุที่ละเอียดอ่อนที่สุดของฝรั่งเศส

Numéro d'Inscription au Répertoire (NIR) — หรือที่เรียกว่า numéro de sécurité sociale — คือหมายเลขประกันสังคมฝรั่งเศส 15 หลัก

รูปแบบคือ: S AA MM DD CCC OOO K

  • S — 1 หลัก: เพศ
  • AA — ปีเกิด
  • MM — เดือนเกิด
  • DD — จังหวัดเกิด (01–95, 2A/2B สำหรับ Corsica, 97–99 โพ้นทะเล, 99 ต่างชาติ)
  • CCC — รหัสเทศบาล
  • OOO — ลำดับเกิด
  • K — เลขตรวจสอบ 2 หลัก (97 − (NIR mod 97))

NIR มีเพศ วันเกิด และสถานที่เกิดอยู่ในหมายเลขเดียว CNIL ถือว่าเป็นความเสี่ยงสูง ต้องได้รับการดูแลเช่นเดียวกับข้อมูลหมวดพิเศษภายใต้ GDPR Article 9

ทำไมเครื่องมือจึงพลาด NIR: เครื่องมือ NLP ทั่วไปล้มเหลวกับ NIR ด้วยสามเหตุผล ประการแรก 15 หลัก (มักเขียนโดยไม่มีช่องว่าง) ดูเหมือนตัวเลขยาวอื่นๆ ประการที่สอง หลักที่ 7–11 มีรหัสจังหวัด เครื่องมือที่ข้ามการตรวจสอบ mod-97 ปล่อย false positive ผ่าน ประการที่สาม จังหวัด Corsica ใช้ 2A และ 2B ไม่ใช่หลักล้วน เครื่องมือที่สร้างสำหรับรูปแบบตัวเลขล้วนล้มเหลวที่นี่

การตรวจจับ NIR ที่ดีต้องการสามสิ่ง: การตรวจสอบเลข key mod-97, codebook ทางภูมิศาสตร์ และกฎที่รองรับ Corsica

ดูที่ security compliance overview ของเราเพื่อดูว่าการครอบคลุมตัวระบุเหมาะสมกับ stack มาตรการป้องกัน GDPR อย่างไร

SIREN และ SIRET: หมายเลขธุรกิจในไฟล์ส่วนบุคคล

SIREN: หมายเลขบริษัทฝรั่งเศส 9 หลักพร้อมเลขตรวจสอบ Luhn ปรากฏในเอกสารทางการค้าฝรั่งเศสทั้งหมด

SIRET: หมายเลข 14 หลักที่สร้างจาก SIREN (9 หลัก) บวกรหัสสาขา (5 หลัก) SIRET ระบุสาขา SIREN ระบุบริษัท

ไฟล์ธุรกิจมักมีหมายเลข SIRET ถัดจากชื่อพนักงาน CNIL ถือว่า SIRET บวกชื่อเป็นข้อมูลส่วนบุคคล คู่นั้นเปิดใช้กฎ GDPR แม้ไม่มีฟิลด์ข้อมูลส่วนบุคคลแยกต่างหาก

ขั้นตอนการทำให้นิรนามหกขั้นตอนสำหรับการฝึก AI

แนวทาง AI ปี 2024 ของ CNIL ครอบคลุมข้อมูลหกประเภท แต่ละประเภทต้องจัดการก่อนใช้ข้อมูลส่วนบุคคลฝรั่งเศสในการฝึก AI:

  1. ลบตัวระบุโดยตรง — ชื่อ, NIR, SIREN ต้องถูกแทนที่หรือลบ
  2. ลดความแม่นยำของ quasi-identifier — อายุ, จังหวัด, อาชีพสามารถรวมกันเพื่อระบุตัวคนได้ ลดความแม่นยำของพวกเขา
  3. เพิ่ม noise ให้ตัวเลข — ฟิลด์ตัวเลขต้องการ noise ที่ปรับเทียบเพื่อป้องกันการอนุมาน
  4. ตรวจสอบ k-anonymity — แต่ละคนต้องดูเหมือนกับอย่างน้อย k-1 คนอื่น CNIL ชี้ไปที่ k ≥ 5
  5. ตรวจสอบ l-diversity — แอตทริบิวต์ที่ละเอียดอ่อนต้องแตกต่างกันภายในแต่ละกลุ่ม
  6. ทำการตรวจสอบความเสี่ยงในการระบุตัวตนซ้ำ — ใช้วิธีที่มีเอกสารก่อนเผยแพร่ข้อมูลใดๆ

การลบ NIR และชื่อเต็มเพียงอย่างเดียวไม่เพียงพอ CNIL พบเรื่องนี้ในการบังคับใช้ Quasi-identifier เช่น รหัสไปรษณีย์และความเชี่ยวชาญทางการแพทย์ก็ต้องได้รับการจัดการด้วย

GDPR compliance guide ของเราครอบคลุมบันทึกที่การตรวจสอบของ French DPA คาดหวัง

บริบทภาษาสำหรับการตรวจจับ PII ภาษาฝรั่งเศส

ฝรั่งเศสมีบริบททางภาษาหลายอย่างที่ส่งผลต่อการตรวจจับ

ภาษาฝรั่งเศสมาตรฐาน เป็นภาษาของเอกสารทางการทั้งหมด โมเดล NER ต้องจัดการตัวอักษรที่มีเครื่องหมาย: é, è, ê, ë, à, â, î, ô, û, ç, œ

ดินแดนโพ้นทะเล (DOM-TOM): Martinique, Guadeloupe, Réunion, Guyane และ Mayotte ใช้รหัส NIR ในช่วง 97–98 รูปแบบชื่อท้องถิ่นต่างจากฝรั่งเศสแผ่นดินใหญ่

Alsace-Moselle: ชื่อที่มีต้นกำเนิดภาษาเยอรมันและรูปแบบเอกสารเยอรมันบางส่วนปรากฏในระเบียนฝรั่งเศส โมเดลที่ฝึกเฉพาะภาษาฝรั่งเศสมาตรฐานอาจพลาดสิ่งเหล่านี้

การใช้ข้ามพรมแดน: ภาษาฝรั่งเศสของเบลเยียมใช้รูปแบบหมายเลขประจำตัวที่แตกต่าง เครื่องมือที่ใช้ในฝรั่งเศสและเบลเยียมต้องมีกฎสำหรับแต่ละประเทศ

สิ่งที่เครื่องมือของคุณต้องครอบคลุม

การปฏิบัติตามกฎหมายฝรั่งเศสต้องการความสามารถทางเทคนิคสี่ประการ:

  1. NIR พร้อมการตรวจสอบ mod-97 — การจับคู่รูปแบบเพียงอย่างเดียวล้มเหลว เครื่องมือต้องเรียกใช้การตรวจสอบ key และจัดการรหัส 2A/2B
  2. SIREN/SIRET พร้อมการตรวจสอบ Luhn — หมายเลขธุรกิจปรากฏในไฟล์ส่วนบุคคลและสร้างการรวมชื่อที่ GDPR ครอบคลุม
  3. NER ภาษาฝรั่งเศสพร้อมการรองรับเครื่องหมายเต็มรูปแบบ — ต้องจัดการชื่อผสม (Jean-Pierre), บุพบท (de, du, des) และตัวอักษรที่มีเครื่องหมาย
  4. กระบวนการหกขั้นตอนที่มีเอกสาร — ไปป์ไลน์การฝึก AI ใดๆ บนข้อมูลฝรั่งเศสต้องมีบันทึกเป็นลายลักษณ์อักษรสำหรับกิจกรรมการทำให้นิรนามแต่ละอย่าง

แหล่งอ้างอิง

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

เริ่มทำให้ PII เป็นนิรนามด้วยประเภทเอนทิตีมากกว่า 285 ประเภทใน 48 ภาษา.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.