By · Last updated 2026-06-05

Retour au blogGDPR & Conformité

Ce que Presidio oublie : Les 220+ types d'entités...

Presidio est livré avec environ 40 reconnaisseurs d'entités par défaut axés sur les identifiants américains.

June 5, 20267 min de lecture
Presidio entity coverageEU GDPR PIIIBAN detectionEuropean identifiersPresidio vs managed

Presidio Manque 220+ Entités RGPD : L'Écart de Couverture EU

Mis à jour pour 2026

Microsoft Presidio inclut environ 40 reconnaisseurs d'entités par défaut. Pour les déploiements aux États-Unis, c'est suffisant. Il couvre les SSN, les passeports US, les permis de conduire, les cartes de crédit et les e-mails.

Pour les déploiements en Europe, l'écart est important. Le RGPD couvre toutes les données personnelles dans l'UE. Cela s'applique quelle que soit la nationalité de la personne concernée. Les équipes européennes ont besoin de reconnaisseurs que Presidio ne fournit pas.

Ce Que Presidio Inclut

Les reconnaisseurs par défaut se divisent en quatre groupes.

Identifiants américains :

  • Numéro de sécurité sociale US (SSN)
  • Numéro de passeport US
  • Numéro de permis de conduire US
  • Numéro de compte bancaire US
  • US ITIN
  • Numéro de licence médicale US

Identifiants universels :

  • Adresse e-mail
  • Numéro de téléphone
  • Adresse IP
  • Numéro de carte de crédit
  • Adresse de portefeuille crypto
  • URL

Entités textuelles (basées sur NER) :

  • PERSON
  • LOCATION
  • ORGANIZATION
  • DATE_TIME

Couverture internationale limitée :

  • Numéro NHS britannique
  • National Insurance Number britannique (NINO)
  • Quelques identifiants financiers

Total : environ 40 reconnaisseurs.

Ce Dont Les Équipes EU Ont Besoin

Identifiants Financiers

L'IBAN apparaît dans presque tous les documents commerciaux en UE. Il figure dans les paiements, les factures et les fiches de paie. L'IBAN suit la norme ISO 13616. Presidio n'a pas de reconnaisseur IBAN.

Prenons une fintech allemande. Chaque fichier de paiement contient un IBAN. Sans détection IBAN, l'outil cherche uniquement les numéros de carte de crédit. L'identifiant de paiement principal en UE est ignoré. Une donnée personnelle centrale au sens du RGPD n'est jamais détectée.

Numéros d'Identification Fiscale

Aucun de ces identifiants n'est dans la bibliothèque par défaut de Presidio :

  • Steueridentifikationsnummer allemand : 11 chiffres
  • NIR français : 15 chiffres avec clé de vérification
  • Codice Fiscale italien : 16 caractères avec somme de contrôle
  • NIF/NIE espagnol : 9 caractères avec lettre
  • BSN néerlandais : 9 chiffres avec validation elfproef

Une équipe de paie européenne traite des fichiers de nombreux États membres. Sans ces reconnaisseurs, elle rate les identifiants financiers les plus sensibles dans ces dossiers.

Identifiants de Santé

Le numéro NHS britannique est couvert. Ces identifiants ne le sont pas :

  • NIR français (aussi utilisé comme identifiant santé)
  • Krankenkassennummer allemand
  • Codice Fiscale italien (aussi utilisé comme identifiant santé)
  • BSN néerlandais (utilisé pour l'assurance maladie)

Les organisations de santé en UE ont besoin de ces identifiants pour la protection des données de santé au niveau RGPD.

Permis de Conduire EU

Les permis de conduire en UE relèvent de la Directive 2006/126/CE. Chaque État membre a son propre format. La structure alphanumérique varie par pays. Presidio n'a que des reconnaisseurs pour les permis américains. Il n'a aucun support pour les permis européens. Les données des permis européens passent donc sans être détectées.

Numéros de TVA

Les numéros de TVA de l'UE apparaissent dans chaque transaction B2B. Format : code pays 2 lettres plus 8 à 12 chiffres alphanumériques. Presidio n'a pas de reconnaisseur TVA. Les numéros de TVA lient les entreprises et leurs propriétaires. Ils constituent des données personnelles au sens du RGPD.

Pour en savoir plus sur les obligations RGPD, consultez nos ressources conformité RGPD.

Le Coût des Reconnaisseurs Personnalisés

Quand les équipes européennes découvrent l'écart, elles développent des reconnaisseurs personnalisés. Le travail s'accumule.

Temps par reconnaisseur (estimation indicative) :

  • Recherche du format : 1–2 heures
  • Écriture de la classe Python : 2–4 heures
  • Implémentation de la regex et la validation : 2–4 heures
  • Ajout des mots de contexte : 1–2 heures
  • Écriture des tests : 2–3 heures
  • Déploiement et vérification : 1–2 heures

Soit 9–17 heures par reconnaisseur. Ce sont des estimations indicatives.

Exemple : une fintech allemande a besoin de quatre reconnaisseurs.

IBAN, Steuer-ID, permis de conduire EU, TVA allemande.

  • 4 reconnaisseurs à 13 heures chacun = 52 heures de travail
  • À 100 €/heure : environ 5 200 €

Cela ne couvre que la première construction. Les formats changent avec le temps. De nouveaux cas limites apparaissent. Les mises à jour de l'API Presidio peuvent tout casser. Chaque modification nécessite un développeur. Les coûts continus augmentent année après année.

La Bibliothèque Managée

anonym.legal étend Presidio avec 285+ types d'entités. L'équipe maintient la bibliothèque à jour. Les identifiants européens sont inclus dès le premier jour.

Ce qui va au-delà des valeurs par défaut de Presidio :

  • IBAN dans tous les formats des États membres de l'UE
  • Identifiants fiscaux des États membres : Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL et plus
  • Identifiants de santé nationaux EU
  • Numéros de TVA (format UE)
  • Formats de permis de conduire EU
  • Formats de passeports européens
  • Variantes d'entités dans 48 langues supportées

Quand l'Allemagne met à jour un format d'identifiant fiscal, la mise à jour est livrée avec le service. Pas besoin de pull request de votre équipe.

Pour les identifiants non présents dans la bibliothèque, le générateur d'entités personnalisées permet d'ajouter des motifs. Aucun code Python n'est nécessaire.

Consultez nos détails sécurité et conformité pour le fonctionnement des mises à jour et des pistes d'audit.

Exemple : Fintech Allemande

Une fintech allemande doit détecter les IBAN, BIC, Steuer-ID et Handelsregisternummern dans les fichiers clients.

Taux de détection par défaut de Presidio pour ces quatre types : 0 %.

Aucun n'est dans la bibliothèque par défaut. Ce n'est pas une faible précision. C'est zéro détection. L'outil ne les rate pas en partie. Il ne les voit pas du tout.

Comparaison des coûts :

ApprocheCoût en première année
Reconnaisseurs personnalisés (4 × 13 h à 100 €/h)~5 200 € plus maintenance
Bibliothèque d'entités managée (plan Pro)180 €/an, les quatre couverts

L'écart est d'environ 29x la première année. Chaque année suivante, la maintenance du développement personnalisé s'accumule. Le prix du service managé reste stable.

Conclusion

Les valeurs par défaut de Presidio servent bien les cas d'usage américains. Pour les déploiements en UE sous le RGPD, elles sont insuffisantes. L'écart nécessite soit un développement de reconnaisseurs personnalisés, soit un service managé.

Pour les équipes EU où la conformité est obligatoire et le temps d'ingénierie limité, une bibliothèque d'entités EU prête à l'emploi supprime un projet de 50+ heures. Les fichiers peuvent être traités dès le premier jour. Aucun code personnalisé n'est nécessaire au préalable.

Sources

Prêt à protéger vos données ?

Commencez à anonymiser les PII avec plus de 285 types d'entités dans 48 langues.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.