Hvorfor Regex, Ikke AI?

For at overholde reguleringer har du brug for resultater, du kan forklare og reproducere. Vores deterministiske tilgang leverer netop det—ingen black boxes, ingen overraskelser.

Detaljeret Sammenligning

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Strukturerede Data
Regex Mønstre
E-mails, CPR-numre, kreditkort, IBAN, telefonnumre
Navne & Organisationer
ML Modeller (spaCy, Stanza)
Personnavne, firmanavne, steder
48 Sprog
XLM-RoBERTa
Tvær-sproglig enhedsgenkendelse
Reproducerbarhed
100% Reproducerbar
Samme input = samme output, hver gang
Navnegenerering
Høj Præcision ML
Dokumenterede NLP-modeller med tillidsscore
Revidérbarhed
+Fuldstændig Revisionsbar
Position, type, tillid for hver enhed

Hvordan Mønstergenkendelse Fungerer

Hver enhedstype har omhyggeligt udformede regex-mønstre, der matcher specifikke formater.

E-mail Adresser

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Matcher standard e-mail format: local-part@domain.tld

Kreditkortnumre

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Matcher Visa, Mastercard, Amex, og andre kortformater med Luhn-validering

Tysk IBAN

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Matcher tysk IBAN format med valgfri mellemrum

Bygget til Overholdelse

Når revisorer spørger "hvorfor blev dette detekteret?" har du brug for et klart svar. Vores regex-baserede tilgang giver netop det.

  • GDPR Artikel 25: Privatliv ved design med forklarlig behandling
  • ISO 27001: Dokumenterede, gentagelige processer
  • Revisionsspor: Hver detektion kan spores til et specifikt mønster

Eksempel Revisionssvar

Q: Hvorfor blev "john.smith@company.com" flagget?
A: Matched e-mail mønster på position 45-68 med tillid 0.95. Mønster: standard e-mail format validering.

Oplev Deterministisk Detektion

Prøv vores regex-baserede PII detektion gratis med 200 tokens pr. cyklus.