anonym.legal

De ce Regex, Nu AI?

Pentru conformitate reglementară, aveți nevoie de rezultate pe care le puteți explica și reproduce. Abordarea noastră deterministă oferă exact asta—fără cutii negre, fără surprize.

Comparare Detaliată

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Date Structurate
Tipare Regex
Emailuri, SSN-uri, carduri de credit, IBAN-uri, numere de telefon
Nume & Organizații
Modele ML (spaCy, Stanza)
Nume de persoane, nume de companii, locații
48 Limbi
XLM-RoBERTa
Recunoașterea entităților translinguale
Reproducibilitate
100% Reproducibil
Același input = același output, de fiecare dată
Detecția Numele
Acuratețe Ridicată ML
Modele NLP dovedite cu scoruri de încredere
Auditabilitate
+Complet Auditabil
Poziție, tip, încredere pentru fiecare entitate

Cum Funcționează Potrivirea Modelului

Fiecare tip de entitate are modele regex atent concepute care se potrivesc formatelor specifice.

Adrese de Email

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Se potrivește cu formatul standard de email: local-part@domain.tld

Numere de Card de Credit

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Se potrivește cu formatele Visa, Mastercard, Amex și alte formate de card cu validare Luhn

IBAN German

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Se potrivește cu formatul IBAN german cu spații opționale

Construit pentru Conformitate

Când auditorii întreabă "de ce a fost detectat acest lucru?" aveți nevoie de un răspuns clar. Abordarea noastră bazată pe regex oferă exact asta.

  • Articolul 25 GDPR: Confidențialitate prin design cu procesare explicabilă
  • ISO 27001: Procese documentate, repetabile
  • Cale de Audit: Fiecare detectare poate fi urmărită până la un model specific

Exemplu de Răspuns la Audit

Î: De ce a fost marcat "john.smith@company.com"?
R: S-a potrivit cu modelul de email la poziția 45-68 cu încredere 0.95. Model: validare a formatului standard de email.

Experimentați Detectarea Deterministă

Încercați detectarea PII bazată pe regex gratuit cu 200 de tokenuri pe ciclu.