Varför Regex, Inte AI?

För regulatorisk efterlevnad behöver du resultat som du kan förklara och reproducera. Vår deterministiska strategi ger precis det—inga svarta lådor, inga överraskningar.

Detaljerad Jämförelse

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Strukturerad Data
Regex-mönster
E-post, personnummer, kreditkort, IBAN, telefonnummer
Namn & Organisationer
ML-modeller (spaCy, Stanza)
Personnamn, företagsnamn, platser
48 Språk
XLM-RoBERTa
Tvärspråklig entitetsigenkänning
Reproducerbarhet
100% Reproducerbar
Samma indata = samma utdata, varje gång
Namnigenkänning
Hög noggrannhet ML
Beprövade NLP-modeller med förtroendepoäng
Granskbarhet
+Helt reviderbar
Position, typ, förtroende för varje entitet

Hur Mönsterigenkänning Fungerar

Varje entitetstyp har noggrant utformade regex-mönster som matchar specifika format.

E-postadresser

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Matchar standard e-postformat: lokal-del@domän.tld

Kreditkortsnummer

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Matchar Visa, Mastercard, Amex och andra kortformat med Luhn-validering

Tysk IBAN

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Matchar tyskt IBAN-format med valfria mellanslag

Byggd för Efterlevnad

När revisorer frågar "varför upptäcktes detta?" behöver du ett klart svar. Vår regex-baserade strategi ger precis det.

  • GDPR Artikel 25: Integritet genom design med förklarlig bearbetning
  • ISO 27001: Dokumenterade, upprepbara processer
  • Revisionsspår: Varje upptäckte kan spåras till ett specifikt mönster

Exempel på Revisionssvar

Fråga: Varför flaggades "john.smith@company.com"?
Svar: Matchade e-postmönster vid position 45-68 med konfidens 0.95. Mönster: standard e-postformatvalidering.

Upplev Deterministisk Upptäckte

Prova vår regex-baserade PII-upptäckte gratis med 200 tokens per cykel.