Un outil, 45 pays : 260+ entités
Les plateformes mondiales traitent des données personnelles provenant de nombreux pays à la fois. Chaque pays a ses propres formats d'identifiants. Chaque format a ses propres règles. Un seul outil de détection doit tous les gérer. La plupart des outils n'y parviennent pas.
Le problème de la fragmentation des identifiants
Une marketplace avec des vendeurs dans 45 pays reçoit des documents d'intégration très différents. Un vendeur brésilien soumet un CPF. Il comporte 11 chiffres. Deux sont des chiffres de contrôle. Ils utilisent une formule de pondération spécifique. Un vendeur indien soumet un PAN. Il comporte 10 caractères. Les lettres et les chiffres apparaissent à des positions fixes. Un vendeur allemand soumet un Steuer-ID. Il comporte 11 chiffres et une somme de contrôle Luhn. Un vendeur néerlandais soumet un BSN. Il comporte 9 chiffres et utilise une validation modulo 11.
Chaque format a une longueur et une structure différentes. Un regex conçu pour un format ne correspond pas aux autres. Un modèle large « 10 à 12 chiffres » capture trop. Il signale des prix, des dates et des numéros de référence. Les faux positifs augmentent rapidement à grande échelle.
L'écart des 40 identifiants
La plupart des outils PII d'entreprise sont fournis avec environ 40 types d'identifiants. Les plus courants sont :
- Numéro de sécurité sociale américain
- Format de passeport américain
- Permis de conduire américain
- Formats de carte de crédit génériques avec validation Luhn
- Adresses e-mail
- Numéros de téléphone au format NANP
- Adresses IP
Ces identifiants couvrent bien la conformité nord-américaine. Ils ne couvrent pas les opérations mondiales.
L'écart par région
Amérique du Sud : Le CPF et le CNPJ brésiliens utilisent des algorithmes de somme de contrôle de l'autorité fiscale brésilienne. Le CUIT argentin utilise une formule à somme pondérée différente. Le NIT colombien a sa propre méthode de validation. Aucun de ces formats ne correspond aux modèles américains.
Asie : Le PAN indien, l'Aadhaar, le GSTIN et la carte d'électeur ont chacun un format distinct. Le My Number japonais comporte 12 chiffres. Le numéro d'enregistrement des résidents coréens et la carte d'identité nationale chinoise nécessitent chacun leur propre module de reconnaissance.
États membres de l'UE : Une couverture complète de l'UE nécessite les formats IBAN des 27 États membres. Chacun a une longueur et un format propres au pays. Il faut également chaque format d'identifiant national. Cela inclut le Steuer-ID allemand, le NIR français, le BSN néerlandais, le PESEL polonais et le Personnummer suédois. Cela inclut aussi l'EMŠO slovène, l'OIB croate, l'EGN bulgare et le CNP roumain.
Ce que couvrent 260+ types d'entités
Une bibliothèque de 260+ entités couvre tous les identifiants nationaux des 27 États membres de l'UE. Elle valide tous les formats IBAN de l'UE. Elle couvre les identifiants d'Amérique du Sud : CPF et CNPJ brésilien, CUIT argentin, NIT colombien. Elle couvre les identifiants asiatiques : PAN indien, Aadhaar, GSTIN, My Number japonais, RRN coréen. Elle couvre les identifiants britanniques : NI Number, NHS Number, variantes NINO. Elle couvre les identifiants médicaux : NPI américain, numéros DEA, formats MRN hospitaliers. Elle couvre les identifiants financiers : codes SWIFT, formats BIC, modèles de numéros de compte.
Pourquoi la couverture de détection est une question de conformité
Chaque cadre réglementaire exige que ses identifiants soient trouvés et protégés. Le RGPD couvre les données des vendeurs de l'UE. La LGPD couvre les données des vendeurs brésiliens. La loi DPDP indienne couvre les données des vendeurs indiens.
« Protection appropriée » signifie que l'outil a trouvé l'identifiant. Un Aadhaar manqué n'est pas un échec de configuration. C'est un échec de couverture. Pour les plateformes mondiales, cet écart est la différence entre une conformité partielle et une protection réelle.
Un déploiement unique avec 260+ entités gère toutes ces juridictions. Pas d'outils régionaux séparés. Pas de pipelines de traitement distincts. Pas d'enrichissement manuel pour les formats qu'un outil à 40 reconnaisseurs manque.
Pour en savoir plus sur la façon dont la couverture correspond aux obligations RGPD, consultez les ressources de conformité RGPD. Pour les politiques de piste d'audit et de mise à jour, consultez les détails de sécurité et de conformité.