Presidio Manque 220+ Entités RGPD : L'Écart de Couverture EU
Mis à jour pour 2026
Microsoft Presidio inclut environ 40 reconnaisseurs d'entités par défaut. Pour les déploiements aux États-Unis, c'est suffisant. Il couvre les SSN, les passeports US, les permis de conduire, les cartes de crédit et les e-mails.
Pour les déploiements en Europe, l'écart est important. Le RGPD couvre toutes les données personnelles dans l'UE. Cela s'applique quelle que soit la nationalité de la personne concernée. Les équipes européennes ont besoin de reconnaisseurs que Presidio ne fournit pas.
Ce Que Presidio Inclut
Les reconnaisseurs par défaut se divisent en quatre groupes.
Identifiants américains :
- Numéro de sécurité sociale US (SSN)
- Numéro de passeport US
- Numéro de permis de conduire US
- Numéro de compte bancaire US
- US ITIN
- Numéro de licence médicale US
Identifiants universels :
- Adresse e-mail
- Numéro de téléphone
- Adresse IP
- Numéro de carte de crédit
- Adresse de portefeuille crypto
- URL
Entités textuelles (basées sur NER) :
- PERSON
- LOCATION
- ORGANIZATION
- DATE_TIME
Couverture internationale limitée :
- Numéro NHS britannique
- National Insurance Number britannique (NINO)
- Quelques identifiants financiers
Total : environ 40 reconnaisseurs.
Ce Dont Les Équipes EU Ont Besoin
Identifiants Financiers
L'IBAN apparaît dans presque tous les documents commerciaux en UE. Il figure dans les paiements, les factures et les fiches de paie. L'IBAN suit la norme ISO 13616. Presidio n'a pas de reconnaisseur IBAN.
Prenons une fintech allemande. Chaque fichier de paiement contient un IBAN. Sans détection IBAN, l'outil cherche uniquement les numéros de carte de crédit. L'identifiant de paiement principal en UE est ignoré. Une donnée personnelle centrale au sens du RGPD n'est jamais détectée.
Numéros d'Identification Fiscale
Aucun de ces identifiants n'est dans la bibliothèque par défaut de Presidio :
- Steueridentifikationsnummer allemand : 11 chiffres
- NIR français : 15 chiffres avec clé de vérification
- Codice Fiscale italien : 16 caractères avec somme de contrôle
- NIF/NIE espagnol : 9 caractères avec lettre
- BSN néerlandais : 9 chiffres avec validation elfproef
Une équipe de paie européenne traite des fichiers de nombreux États membres. Sans ces reconnaisseurs, elle rate les identifiants financiers les plus sensibles dans ces dossiers.
Identifiants de Santé
Le numéro NHS britannique est couvert. Ces identifiants ne le sont pas :
- NIR français (aussi utilisé comme identifiant santé)
- Krankenkassennummer allemand
- Codice Fiscale italien (aussi utilisé comme identifiant santé)
- BSN néerlandais (utilisé pour l'assurance maladie)
Les organisations de santé en UE ont besoin de ces identifiants pour la protection des données de santé au niveau RGPD.
Permis de Conduire EU
Les permis de conduire en UE relèvent de la Directive 2006/126/CE. Chaque État membre a son propre format. La structure alphanumérique varie par pays. Presidio n'a que des reconnaisseurs pour les permis américains. Il n'a aucun support pour les permis européens. Les données des permis européens passent donc sans être détectées.
Numéros de TVA
Les numéros de TVA de l'UE apparaissent dans chaque transaction B2B. Format : code pays 2 lettres plus 8 à 12 chiffres alphanumériques. Presidio n'a pas de reconnaisseur TVA. Les numéros de TVA lient les entreprises et leurs propriétaires. Ils constituent des données personnelles au sens du RGPD.
Pour en savoir plus sur les obligations RGPD, consultez nos ressources conformité RGPD.
Le Coût des Reconnaisseurs Personnalisés
Quand les équipes européennes découvrent l'écart, elles développent des reconnaisseurs personnalisés. Le travail s'accumule.
Temps par reconnaisseur (estimation indicative) :
- Recherche du format : 1–2 heures
- Écriture de la classe Python : 2–4 heures
- Implémentation de la regex et la validation : 2–4 heures
- Ajout des mots de contexte : 1–2 heures
- Écriture des tests : 2–3 heures
- Déploiement et vérification : 1–2 heures
Soit 9–17 heures par reconnaisseur. Ce sont des estimations indicatives.
Exemple : une fintech allemande a besoin de quatre reconnaisseurs.
IBAN, Steuer-ID, permis de conduire EU, TVA allemande.
- 4 reconnaisseurs à 13 heures chacun = 52 heures de travail
- À 100 €/heure : environ 5 200 €
Cela ne couvre que la première construction. Les formats changent avec le temps. De nouveaux cas limites apparaissent. Les mises à jour de l'API Presidio peuvent tout casser. Chaque modification nécessite un développeur. Les coûts continus augmentent année après année.
La Bibliothèque Managée
anonym.legal étend Presidio avec 285+ types d'entités. L'équipe maintient la bibliothèque à jour. Les identifiants européens sont inclus dès le premier jour.
Ce qui va au-delà des valeurs par défaut de Presidio :
- IBAN dans tous les formats des États membres de l'UE
- Identifiants fiscaux des États membres : Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL et plus
- Identifiants de santé nationaux EU
- Numéros de TVA (format UE)
- Formats de permis de conduire EU
- Formats de passeports européens
- Variantes d'entités dans 48 langues supportées
Quand l'Allemagne met à jour un format d'identifiant fiscal, la mise à jour est livrée avec le service. Pas besoin de pull request de votre équipe.
Pour les identifiants non présents dans la bibliothèque, le générateur d'entités personnalisées permet d'ajouter des motifs. Aucun code Python n'est nécessaire.
Consultez nos détails sécurité et conformité pour le fonctionnement des mises à jour et des pistes d'audit.
Exemple : Fintech Allemande
Une fintech allemande doit détecter les IBAN, BIC, Steuer-ID et Handelsregisternummern dans les fichiers clients.
Taux de détection par défaut de Presidio pour ces quatre types : 0 %.
Aucun n'est dans la bibliothèque par défaut. Ce n'est pas une faible précision. C'est zéro détection. L'outil ne les rate pas en partie. Il ne les voit pas du tout.
Comparaison des coûts :
| Approche | Coût en première année |
|---|---|
| Reconnaisseurs personnalisés (4 × 13 h à 100 €/h) | ~5 200 € plus maintenance |
| Bibliothèque d'entités managée (plan Pro) | 180 €/an, les quatre couverts |
L'écart est d'environ 29x la première année. Chaque année suivante, la maintenance du développement personnalisé s'accumule. Le prix du service managé reste stable.
Conclusion
Les valeurs par défaut de Presidio servent bien les cas d'usage américains. Pour les déploiements en UE sous le RGPD, elles sont insuffisantes. L'écart nécessite soit un développement de reconnaisseurs personnalisés, soit un service managé.
Pour les équipes EU où la conformité est obligatoire et le temps d'ingénierie limité, une bibliothèque d'entités EU prête à l'emploi supprime un projet de 50+ heures. Les fichiers peuvent être traités dès le premier jour. Aucun code personnalisé n'est nécessaire au préalable.