Kodėl Regex, o ne AI?

Reguliavimo atitikties tikslais jums reikia rezultatų, kuriuos galite paaiškinti ir atkartoti. Mūsų deterministinis požiūris suteikia būtent tai—jokios juodosios dėžės, jokių staigmenų.

Išsami palyginimas

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Struktūrizuoti Duomenys
Regex Šablonai
El. paštai, SSN, kreditinės kortelės, IBAN, telefono numeriai
Vardai ir Organizacijos
ML Modeliai (spaCy, Stanza)
Asmenų vardai, įmonių pavadinimai, vietovės
48 Kalbos
XLM-RoBERTa
Kryžminis kalbų subjektų atpažinimas
Atkartojamumas
100% Atkartojama
Tas pats įvestis = tas pats išvestis, kiekvieną kartą
Vardų Aptikimas
Aukštas Tikslumas ML
Įrodyti NLP modeliai su pasitikėjimo balais
Audituojamumas
+Visiškai Audituojama
Pozicija, tipas, pasitikėjimas kiekvienam subjektui

Kaip veikia modelių atitikimas

Kiekvienas subjektų tipas turi kruopščiai sukurtus regex modelius, kurie atitinka specifinius formatus.

El. pašto adresai

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Atitinka standartinį el. pašto formatą: local-part@domain.tld

Kredito kortelių numeriai

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Atitinka Visa, Mastercard, Amex ir kitų kortelių formatus su Luhn validacija

Vokietijos IBAN

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Atitinka Vokietijos IBAN formatą su neprivalomais tarpais

Sukurtas atitikties tikslais

Kai auditoriai klausia "kodėl tai buvo aptikta?" jums reikia aiškaus atsakymo. Mūsų regex pagrindu veikiantis požiūris suteikia būtent tai.

  • GDPR 25 straipsnis: Privatumas pagal dizainą su paaiškinamu apdorojimu
  • ISO 27001: Dokumentuoti, pakartojami procesai
  • Audito takas: Kiekviena detekcija gali būti atsekama iki konkretaus modelio

Pavyzdys audito atsakymo

K: Kodėl "john.smith@company.com" buvo pažymėtas?
A: Atitiko el. pašto modelį pozicijoje 45-68 su pasitikėjimu 0.95. Modelis: standartinio el. pašto formato validacija.

Patirkite deterministinę detekciją

Išbandykite mūsų regex pagrindu veikiančią PII detekciją nemokamai su 200 tokenų per ciklą.