anonym.legal

Miért Regex, Nem AI?

A szabályozási megfeleléshez olyan eredményekre van szüksége, amelyeket elmagyarázhat és reprodukálhat. A determinisztikus megközelítésünk pontosan ezt nyújtja—nincs fekete doboz, nincsenek meglepetések.

Részletes Összehasonlítás

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Strukturált Adatok
Regex Minták
E-mailek, SSN-ek, hitelkártyák, IBAN-ok, telefonszámok
Nevek és Szervezetek
ML Modellek (spaCy, Stanza)
Személynevek, cégnevek, helyszínek
48 Nyelv
XLM-RoBERTa
Keresztnyelvű entitásfelismerés
Reprodukálhatóság
100% Reprodukálható
Ugyanaz a bemenet = ugyanaz a kimenet, minden alkalommal
Névfelismerés
Magas Pontosságú ML
Bizonyított NLP modellek bizalmi pontszámokkal
Auditálhatóság
+Teljesen Auditálható
Pozíció, típus, bizalom minden entitás esetében

Hogyan Működik a Mintázat-illesztés

Minden entitástípushoz gondosan kidolgozott regex minták tartoznak, amelyek specifikus formátumokat illesztenek.

Email Címek

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Illeszkedik a standard email formátumhoz: helyi-rész@domain.tld

Hitelkártya Számok

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Illeszkedik a Visa, Mastercard, Amex és más kártyaformátumokhoz Luhn érvényesítéssel

Német IBAN

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Illeszkedik a német IBAN formátumhoz, opcionális szóközökkel

Megfelelőségre Építve

Amikor az auditorok megkérdezik, hogy "miért lett észlelve ez?" világos válaszra van szüksége. A regex-alapú megközelítésünk pontosan ezt nyújtja.

  • GDPR 25. Cikk: Adatvédelem a tervezés során magyarázható feldolgozással
  • ISO 27001: Dokumentált, ismételhető folyamatok
  • Audit Nyom: Minden észlelés visszavezethető egy specifikus mintához

Példa Audit Válasz

K: Miért lett a "john.smith@company.com" kiemelve?
V: Email minta illeszkedett a 45-68. pozícióban, bizalom 0.95. Minta: standard email formátum érvényesítése.

Tapasztalja Meg a Determinisztikus Észlelést

Próbálja ki a regex-alapú PII észlelésünket ingyen, 200 tokennel ciklusonként.