By · Last updated 2026-05-31

Retour au blogGDPR & Conformité

Au-delà des numéros de sécurité sociale et des...

Chaque organisation a des identifiants internes — identifiants d'employés, numéros de compte, identifiants de commande...

May 31, 20267 min de lecture
custom PII detectionorganizational identifiersre-identification riskGDPR pseudonymizationcustom entity

Au-delà des SSNs : anonymiser les identifiants internes de votre organisation

Votre outil RGPD supprime les adresses e-mail. Il supprime les numéros de téléphone. Il supprime les noms. Vous faites passer vos exports de tickets de support. Puis vous partagez le résultat avec votre équipe analytics.

Vos numéros de compte client sont toujours dans chaque ticket. Vos identifiants de commande aussi. Vos identifiants utilisateurs internes aussi.

Ces identifiants semblent inoffensifs seuls. Sans table de correspondance, ils ne désignent pas une personne. Mais votre équipe analytics a cette table. Votre CRM aussi. Votre base de données support aussi. N'importe qui avec un accès peut retrouver la personne en quelques secondes.

C'est un échec de pseudonymisation au sens du RGPD. L'outil n'a pas planté. On ne lui a jamais dit de chercher vos identifiants.

Ce que détectent les outils PII standards

Les outils PII standards couvrent les formats universels. Ils capturent ce que chaque organisation utilise.

Les outils standards détectent :

  • Les numéros de sécurité sociale (SSNs US, NINOs UK, formats nationaux EU)
  • Les adresses e-mail
  • Les numéros de téléphone
  • Les numéros de carte bancaire
  • Les noms
  • Les numéros de passeport et de permis de conduire

Les outils standards ne détectent pas :

  • Les identifiants employés au format EMP-XXXXX
  • Les numéros de compte client au format ACC-XXXXXXXX-XX
  • Les identifiants de commande au format ORD-XXXXXXX
  • Les identifiants utilisateurs internes au format UUID ou personnalisé
  • Les codes de référence spécifiques aux partenaires

Les outils standards trouvent des motifs universels. Vos identifiants internes ne sont pas universels. Ils nécessitent une configuration personnalisée pour être détectés.

Le risque de ré-identification

Une entreprise exporte des tickets de support pour un contrôle qualité. La suppression PII standard enlève les noms, e-mails et numéros de téléphone. Les numéros de compte au format ACC-XXXXXXXX-XX ne sont pas touchés.

L'export va à l'équipe analytics. Un analyste fait une jointure entre la table de tickets et la base de données clients sur le numéro de compte. La personne est retrouvée immédiatement. Aucune technique particulière n'est nécessaire. C'est une jointure SQL de routine.

L'article 4(5) du RGPD définit la pseudonymisation comme un traitement où les données « ne peuvent plus être attribuées à une personne concernée précise sans recourir à des informations supplémentaires ». Les numéros de compte échouent à ce test. Les informations supplémentaires — votre base de données clients — sont là, dans votre organisation.

L'export « anonymisé » ne l'était pas.

Créer des motifs d'entités personnalisés

La configuration d'entités personnalisées est rapide. Les équipes conformité peuvent le faire sans aide technique.

Étape 1 : Lister vos formats d'identifiants.

Notez chacun. Par exemple : compte ACC-XXXXXXXX-XX, commande ORD-XXXXXXX, employé EMP-XXXXX.

Étape 2 : Décrire le format en langage courant.

« Les numéros de compte commencent par ACC, puis un tiret, puis 8 chiffres, puis un tiret, puis 2 lettres majuscules. »

La génération de motifs assistée par IA retourne : ACC-\d{8}-[A-Z]{2}

Étape 3 : Tester sur des données d'exemple.

Chargez 20 à 30 documents. Vérifiez que toutes les occurrences sont trouvées. Vérifiez qu'aucun faux positif n'apparaît.

Étape 4 : Choisir une méthode.

Pour les identifiants utilisés comme clés de jointure, où l'analyse doit relier des enregistrements :

  • Pseudonymiser. Remplacer ACC-00123456-AB par ACC-99876543-XY à chaque fois. La même entrée donne toujours la même sortie. Les jointures fonctionnent encore. La valeur d'origine ne peut être retrouvée sans la clé.

Pour les identifiants inutiles dans l'analyse :

  • Supprimer. Remplacer par [REDACTED]. Simple. Définitif.

Étape 5 : Enregistrer comme preset partagé.

Enregistrez l'entité personnalisée — ou un ensemble — dans un preset partagé. La configuration s'applique à tous les usages : uploads en lot, appels API, interface navigateur. Les nouveaux membres de l'équipe obtiennent la configuration complète immédiatement.

Étude de cas : 180 000 tickets de support

Une entreprise a trouvé 180 000 tickets de support dans son entrepôt de données analytics. Les noms et e-mails avaient été supprimés. Les numéros de compte non. Chaque ticket contenait encore une valeur ACC-XXXXXXXX-XX active.

Calendrier de résolution :

  1. Le responsable conformité définit le motif ACC — 15 minutes
  2. Le teste sur 30 tickets d'exemple — 20 minutes
  3. Confirme la précision — 10 minutes
  4. Traite 180 000 tickets en lot pendant la nuit
  5. Remplace les tables de l'entrepôt par les versions nettoyées

Temps total pour le responsable conformité : 45 minutes. Sans la détection d'entités personnalisées, la correction aurait nécessité un ticket engineering, une revue de code et un déploiement. Cela prend des semaines, pas des heures.

Pour comprendre comment les identifiants personnalisés créent des risques dans les outils d'IA support, consultez le guide RGPD pour l'IA support.

Où se propagent les identifiants internes

Les identifiants internes apparaissent à plus d'endroits que la plupart des équipes ne l'imaginent.

Documents internes :

  • Notes de réunion avec des références à des comptes ou commandes
  • Échanges e-mail sur des cas clients
  • Présentations avec des données de cas réels

Partagés avec des tiers :

  • Rapports aux régulateurs avec des numéros de référence
  • Documents d'audit avec des références clients
  • Documents fournisseurs contenant des identifiants clients

Recherche et analytics :

  • Jeux de données de parcours client
  • Exports d'évaluation de la qualité support
  • Données d'entraînement pour les modèles ML internes

Chaque contexte nécessite la même configuration d'entités personnalisées pour produire des données réellement anonymes.

Pseudonymisation vs. anonymisation

Le RGPD trace une ligne claire.

La pseudonymisation remplace les identifiants par des substituts. La personne d'origine peut être retrouvée si quelqu'un a la table de correspondance. Ces données restent des données personnelles. Le risque est réduit. Vos obligations RGPD ne disparaissent pas.

L'anonymisation supprime la possibilité de ré-identifier. Les données anonymes ne sont pas des données personnelles. Le RGPD ne s'y applique pas.

Les numéros de compte et de commande sont pseudonymes lorsque des tables de correspondance existent. Les remplacer par des substituts fixes réduit le risque, mais le RGPD reste applicable. Les remplacer par des tokens aléatoires — et supprimer la clé — supprime l'obligation RGPD, mais empêche les jointures analytiques.

Pour le partage avec des tiers sans vos tables de correspondance : la pseudonymisation peut suffire. Pour les analyses internes, une anonymisation complète ou des contrôles d'accès stricts sont nécessaires. Le guide de conformité légale explique comment documenter chaque approche pour votre registre des traitements.

Conclusion

La lacune n'est pas un échec de l'outil. C'est une lacune de configuration. Aucun outil ne peut connaître votre format de numéro de compte si vous ne le lui indiquez pas.

La configuration d'entités personnalisées comble la lacune en quelques heures. Les équipes conformité définissent les formats, les testent sur des données d'exemple, et les appliquent sur tous les modes de traitement. Aucune aide technique n'est nécessaire.

Les 180 000 numéros de compte non supprimés n'étaient pas là parce que l'outil a échoué. Ils étaient là parce qu'on n'a jamais dit à l'outil de les chercher.

Sources

Prêt à protéger vos données ?

Commencez à anonymiser les PII avec plus de 285 types d'entités dans 48 langues.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.