anonym.legal

By · Last updated 2026-06-05

Πίσω στο BlogGDPR & Συμμόρφωση

CNIL Γαλλία: Τεχνικές Απαιτήσεις DPA για Εργαλεία PII

Η CNIL επεξεργάστηκε 16.433 καταγγελίες το 2023 (+43%). Το 63% των ειδοποιήσεων CNIL αναφέρεται σε ανεπαρκή ανωνυμοποίηση ΑΙ. Το NIR/γαλλικό ΑΦΜ χάνεται από το 78% των γενικών εργαλείων.

June 5, 20269 λεπτά ανάγνωσης
France CNILNIR French SSNGDPR anonymizationFrench data protectionAI training data

CNIL Γαλλία: Τεχνικές Απαιτήσεις DPA για Εργαλεία PII

Η CNIL της Γαλλίας είναι η πιο απαιτητική αρχή δεδομένων στην ΕΕ. Οι περισσότεροι ευρωπαϊκοί ρυθμιστές συντάσσουν γενικούς κανόνες. Η CNIL πηγαίνει πιο μακριά. Δημοσιεύει ακριβείς τεχνικές κατευθυντήριες γραμμές που ονομάζονται recommandations. Αυτές θέτουν ακριβή πρότυπα για ανωνυμοποίηση και χρήση δεδομένων ΑΙ.

Οι ειδοποιήσεις CNIL το 2024 ανέφεραν συχνά αδύναμη ανωνυμοποίηση σε συστήματα ΑΙ. Η υπηρεσία δέχτηκε 16.433 καταγγελίες το 2023. Αυτό ήταν 43% περισσότερες από το 2022.

Η Καθοδήγηση CNIL Διαμορφώνει την Πολιτική της ΕΕ

Τα τεχνικά κείμενα της CNIL χρησιμοποιούνται ευρέως ως αναφορά από άλλες DPA της ΕΕ. Δύο οδηγοί έχουν ιδιαίτερη σημασία.

Guide pratique de l'anonymisation (2023): Αυτός ο οδηγός καλύπτει k-ανωνυμία, l-ποικιλομορφία και διαφορική ιδιωτικότητα. Δείχνει πώς να εφαρμόσετε κάθε μέθοδο σε γαλλικά δεδομένα. Η σουηδική IMY και άλλοι ευρωπαϊκοί φορείς τον αναφέρουν στους δικούς τους κανόνες.

Καθοδήγηση συστημάτων ΑΙ (2024): Η CNIL απαριθμεί έξι τύπους δεδομένων που πρέπει να αντιμετωπίζονται στην εκπαίδευση ΑΙ. Καμία άλλη DPA της ΕΕ δεν έχει πάει τόσο μακριά στο θέμα της ΑΙ.

Κανόνες cookies: Η καθοδήγηση cookies της CNIL θέτει τον υψηλότερο τεχνικό πήχη για εργαλεία συγκατάθεσης στην ΕΕ. Ενημερώνεται συχνά.

Το NIR: Ο Πιο Ευαίσθητος Αναγνωριστής της Γαλλίας

Το Numéro d'Inscription au Répertoire (NIR) — γνωστό και ως numéro de sécurité sociale — είναι ένας 15ψήφιος γαλλικός αριθμός κοινωνικής ασφάλισης.

Η μορφή του είναι: S AA MM DD CCC OOO K

  • S — 1 ψηφίο: φύλο
  • AA — έτος γέννησης
  • MM — μήνας γέννησης
  • DD — τμήμα γέννησης (01–95, 2A/2B για Κορσική, 97–99 υπερπόντιες, 99 αλλοδαπή)
  • CCC — κωδικός δήμου
  • OOO — σειρά γέννησης
  • K — 2ψήφιο κλειδί ελέγχου (97 − (NIR mod 97))

Το NIR περιλαμβάνει φύλο, ημερομηνία γέννησης και τόπο γέννησης σε έναν αριθμό. Η CNIL το αντιμετωπίζει ως υψηλού κινδύνου. Απαιτεί την ίδια φροντίδα με τα δεδομένα ειδικής κατηγορίας βάσει του άρθρου 9 GDPR.

Γιατί τα εργαλεία χάνουν το NIR: Τα γενικά εργαλεία NLP αποτυγχάνουν στο NIR για τρεις λόγους. Πρώτον, τα 15 ψηφία (συχνά γραμμένα χωρίς κενά) μοιάζουν με άλλους μεγάλους αριθμούς. Δεύτερον, τα ψηφία 7–11 περιέχουν κωδικό τμήματος. Εργαλεία που παρακάμπτουν τον έλεγχο mod-97 αφήνουν ψευδώς θετικά. Τρίτον, τα τμήματα Κορσικής χρησιμοποιούν 2A και 2B, όχι καθαρά ψηφία. Εργαλεία που κατασκευάστηκαν για αμιγώς αριθμητικά μοτίβα αποτυγχάνουν εδώ.

Η καλή ανίχνευση NIR χρειάζεται τρία πράγματα: έλεγχο κλειδιού mod-97, γεωγραφικό κώδικα αναφοράς και κανόνες για την Κορσική.

Δείτε την επισκόπηση ασφάλειας και συμμόρφωσής μας για τον τρόπο που η κάλυψη αναγνωριστικών εντάσσεται σε ένα πλαίσιο διασφαλίσεων GDPR.

SIREN και SIRET: Αναγνωριστικά Επιχειρήσεων σε Προσωπικά Αρχεία

SIREN: Ένα 9ψήφιο γαλλικό αναγνωριστικό εταιρείας με ψηφίο ελέγχου Luhn. Εμφανίζεται σε όλα τα γαλλικά εμπορικά έγγραφα.

SIRET: Ένας 14ψήφιος αριθμός που αποτελείται από SIREN (9 ψηφία) και κωδικό εγκατάστασης (5 ψηφία). Το SIRET ονομάζει μια τοποθεσία. Το SIREN ονομάζει την εταιρεία.

Τα επαγγελματικά αρχεία συχνά περιέχουν αριθμούς SIRET δίπλα σε ονόματα προσωπικού. Η CNIL αντιμετωπίζει SIRET μαζί με όνομα ως προσωπικά δεδομένα. Αυτός ο συνδυασμός ενεργοποιεί τους κανόνες GDPR ακόμα και χωρίς ξεχωριστό πεδίο προσωπικών δεδομένων.

Έξι Βήματα Ανωνυμοποίησης για Εκπαίδευση ΑΙ

Η καθοδήγηση ΑΙ της CNIL 2024 καλύπτει έξι τύπους δεδομένων. Κάθε ένας πρέπει να αντιμετωπιστεί πριν χρησιμοποιηθούν γαλλικά προσωπικά αρχεία στην εκπαίδευση ΑΙ:

  1. Αφαίρεση άμεσων αναγνωριστικών — Ονόματα, NIR, SIREN πρέπει να αντικατασταθούν ή να αφαιρεθούν
  2. Γενίκευση ημι-αναγνωριστικών — Ηλικία, τμήμα, επάγγελμα μπορούν να συνδυαστούν για επανα-αναγνώριση ατόμων· μειώστε την ακρίβειά τους
  3. Προσθήκη θορύβου σε αριθμούς — Τα αριθμητικά πεδία χρειάζονται βαθμονομημένο θόρυβο για αποτροπή συμπερασμάτων
  4. Έλεγχος k-ανωνυμίας — Κάθε πρόσωπο πρέπει να μοιάζει με τουλάχιστον k-1 άλλα· η CNIL υποδεικνύει k ≥ 5
  5. Έλεγχος l-ποικιλομορφίας — Τα ευαίσθητα χαρακτηριστικά πρέπει να ποικίλλουν εντός κάθε ομάδας
  6. Εκτέλεση ελέγχου κινδύνου επανα-αναγνώρισης — Χρησιμοποιήστε τεκμηριωμένη μέθοδο πριν από οποιαδήποτε κυκλοφορία δεδομένων

Η αφαίρεση μόνο NIR και πλήρους ονόματος δεν αρκεί. Η CNIL το έχει διαπιστώσει κατά την επιβολή. Ημι-αναγνωριστικά όπως ο ταχυδρομικός κώδικας και η ιατρική ειδικότητα χρειάζονται επίσης αντιμετώπιση.

Ο οδηγός συμμόρφωσης GDPR μας καλύπτει τα αρχεία που περιμένουν οι γαλλικές DPA κατά τον έλεγχο.

Γλωσσικό Πλαίσιο για Ανίχνευση Γαλλικών PII

Η Γαλλία έχει πολλά γλωσσικά πλαίσια που επηρεάζουν την ανίχνευση.

Τυπικά Γαλλικά είναι η γλώσσα όλων των επίσημων εγγράφων. Τα μοντέλα NER πρέπει να χειρίζονται γράμματα με τόνους: é, è, ê, ë, à, â, î, ô, û, ç, œ.

Υπερπόντια εδάφη (DOM-TOM): Μαρτινίκα, Γουαδελούπη, Ρεϊνιόν, Γουιάνα και Μαγιότ χρησιμοποιούν κωδικούς NIR στο εύρος 97–98. Τα τοπικά μοτίβα ονομάτων διαφέρουν από τη μητροπολιτική Γαλλία.

Αλσατία-Μοζέλ: Ονόματα γερμανικής προέλευσης και ορισμένες γερμανικές μορφές εγγράφων εμφανίζονται σε γαλλικά αρχεία. Τα μοντέλα εκπαιδευμένα μόνο σε τυπικά γαλλικά μπορεί να τα χάσουν.

Διασυνοριακή χρήση: Τα βελγικά γαλλικά χρησιμοποιούν διαφορετική μορφή αναγνωριστικού. Τα εργαλεία που χρησιμοποιούνται στη Γαλλία και το Βέλγιο χρειάζονται κανόνες για κάθε χώρα.

Τι Πρέπει να Καλύπτει το Εργαλείο Σας

Η γαλλική συμμόρφωση απαιτεί τέσσερις τεχνικές ικανότητες:

  1. NIR με έλεγχο mod-97 — Η αντιστοίχιση μοτίβων μόνο αποτυγχάνει. Τα εργαλεία πρέπει να εκτελούν τον έλεγχο κλειδιού και να χειρίζονται κωδικούς 2A/2B.
  2. SIREN/SIRET με έλεγχο Luhn — Τα αναγνωριστικά επιχειρήσεων εμφανίζονται σε προσωπικά αρχεία και δημιουργούν συνδυασμούς ονομάτων που καλύπτονται από GDPR.
  3. Γαλλικό NER με πλήρη υποστήριξη τόνων — Πρέπει να χειρίζεται σύνθετα ονόματα (Jean-Pierre), μόρια (de, du, des) και χαρακτήρες με τόνους.
  4. Τεκμηριωμένη εξαπλή διαδικασία — Κάθε αγωγός εκπαίδευσης ΑΙ σε γαλλικά δεδομένα χρειάζεται γραπτό αρχείο για κάθε δραστηριότητα ανωνυμοποίησης.

Πηγές

Έτοιμοι να προστατεύσετε τα δεδομένα σας;

Ξεκινήστε την ανωνυμοποίηση PII με 285+ τύπους οντοτήτων σε 48 γλώσσες.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.