Kodėl Regex, o ne AI?
Reguliavimo atitikties tikslais jums reikia rezultatų, kuriuos galite paaiškinti ir atkartoti. Mūsų deterministinis požiūris suteikia būtent tai—jokios juodosios dėžės, jokių staigmenų.
Išsami palyginimas
We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.
| Entity Type | Detection Method | Examples |
|---|---|---|
| Struktūrizuoti Duomenys | Regex Šablonai | El. paštai, SSN, kreditinės kortelės, IBAN, telefono numeriai |
| Vardai ir Organizacijos | ML Modeliai (spaCy, Stanza) | Asmenų vardai, įmonių pavadinimai, vietovės |
| 48 Kalbos | XLM-RoBERTa | Kryžminis kalbų subjektų atpažinimas |
| Atkartojamumas | 100% Atkartojama | Tas pats įvestis = tas pats išvestis, kiekvieną kartą |
| Vardų Aptikimas | Aukštas Tikslumas ML | Įrodyti NLP modeliai su pasitikėjimo balais |
| Audituojamumas | +Visiškai Audituojama | Pozicija, tipas, pasitikėjimas kiekvienam subjektui |
Kaip veikia modelių atitikimas
Kiekvienas subjektų tipas turi kruopščiai sukurtus regex modelius, kurie atitinka specifinius formatus.
El. pašto adresai
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}Atitinka standartinį el. pašto formatą: local-part@domain.tld
Kredito kortelių numeriai
\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\bAtitinka Visa, Mastercard, Amex ir kitų kortelių formatus su Luhn validacija
Vokietijos IBAN
DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}Atitinka Vokietijos IBAN formatą su neprivalomais tarpais
Sukurtas atitikties tikslais
Kai auditoriai klausia "kodėl tai buvo aptikta?" jums reikia aiškaus atsakymo. Mūsų regex pagrindu veikiantis požiūris suteikia būtent tai.
- GDPR 25 straipsnis: Privatumas pagal dizainą su paaiškinamu apdorojimu
- ISO 27001: Dokumentuoti, pakartojami procesai
- Audito takas: Kiekviena detekcija gali būti atsekama iki konkretaus modelio
Pavyzdys audito atsakymo
Patirkite deterministinę detekciją
Išbandykite mūsų regex pagrindu veikiančią PII detekciją nemokamai su 200 tokenų per ciklą.