Pourquoi Regex, pas IA ?

Pour la conformité réglementaire, vous avez besoin de résultats que vous pouvez expliquer et reproduire. Notre approche déterministe fournit exactement cela—pas de boîtes noires, pas de surprises.

Comparaison détaillée

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Données Structurées
Modèles Regex
Emails, numéros de sécurité sociale, cartes de crédit, IBAN, numéros de téléphone
Noms & Organisations
Modèles ML (spaCy, Stanza)
Noms de personnes, noms d'entreprises, lieux
48 Langues
XLM-RoBERTa
Reconnaissance d'entités multilingues
Reproductibilité
100% Reproductible
Même entrée = même sortie, à chaque fois
Détection de Noms
Haute Précision ML
Modèles NLP éprouvés avec des scores de confiance
Auditabilité
+Entièrement Auditable
Position, type, confiance pour chaque entité

Comment fonctionne l'appariement de motifs

Chaque type d'entité a des motifs regex soigneusement élaborés qui correspondent à des formats spécifiques.

Adresses e-mail

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Correspond au format standard des e-mails : local-part@domain.tld

Numéros de carte de crédit

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Correspond aux formats Visa, Mastercard, Amex et autres cartes avec validation de Luhn

IBAN Allemand

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Correspond au format IBAN allemand avec des espaces optionnels

Conçu pour la conformité

Lorsque les auditeurs demandent "pourquoi cela a-t-il été détecté ?" vous avez besoin d'une réponse claire. Notre approche basée sur regex fournit exactement cela.

  • Article 25 du GDPR : Confidentialité par conception avec un traitement explicable
  • ISO 27001 : Processus documentés et répétables
  • Trace d'audit : Chaque détection peut être retracée à un motif spécifique

Exemple de réponse d'audit

Q : Pourquoi "john.smith@company.com" a-t-il été signalé ?
R : Correspond au motif d'e-mail à la position 45-68 avec une confiance de 0,95. Motif : validation du format standard des e-mails.

Découvrez la détection déterministe

Essayez notre détection PII basée sur regex gratuitement avec 200 jetons par cycle.