anonym.legal

Miksi Regex, ei AI?

Sääntelyvaatimusten vuoksi tarvitset tuloksia, joita voit selittää ja toistaa. Meidän deterministinen lähestymistapamme tarjoaa juuri sitä—ei mustia laatikoita, ei yllätyksiä.

Yksityiskohtainen vertailu

We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.

Entity TypeDetection MethodExamples
Rakenteellinen Data
Regex-mallit
Sähköpostit, henkilötunnukset, luottokortit, IBANit, puhelinnumerot
Nimet & Organisaatiot
ML-mallit (spaCy, Stanza)
Henkilöiden nimet, yritysten nimet, sijainnit
48 Kieltä
XLM-RoBERTa
Ristiin kielten entiteettien tunnistus
Toistettavuus
100% Toistettavissa
Sama syöte = sama tulos, joka kerta
Nimen Tunnistus
Korkea Tarkkuus ML
Todistetut NLP-mallit luottamusarvioilla
Auditointi
+Täysin Auditoitavissa
Sijainti, tyyppi, luottamus jokaiselle entiteetille

Kuinka kaavojen vertailu toimii

Jokaisella entiteettityypillä on huolellisesti laaditut regex-kaavat, jotka vastaavat tiettyjä muotoja.

Sähköpostiosoitteet

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

Vastaavat standardisähköpostimuotoa: paikallinen-osa@domain.tld

Luottokorttinumerot

\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\b

Vastaavat Visaa, Mastercardia, Amexia ja muita korttimuotoja Luhn-validoinnilla

Saksalainen IBAN

DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}

Vastaavat saksalaista IBAN-muotoa valinnaisilla välilyönneillä

Rakennettu vaatimustenmukaisuutta varten

Kun tarkastajat kysyvät "miksi tämä tunnistettiin?" tarvitset selkeän vastauksen. Meidän regex-pohjainen lähestymistapamme tarjoaa juuri sen.

  • GDPR 25. artikla: Tietosuoja suunnittelussa selitettävällä käsittelyllä
  • ISO 27001: Dokumentoidut, toistettavat prosessit
  • Audit Trail: Jokainen tunnistus voidaan jäljittää tiettyyn kaavaan

Esimerkki tarkastusvastauksesta

K: Miksi "john.smith@company.com" merkittiin?
V: Vastaava sähköpostikaava sijainnissa 45-68 luottamuspisteellä 0.95. Kaava: standardisähköpostimuodon validointi.

Koe deterministinen tunnistus

Kokeile regex-pohjaista PII-tunnistustamme ilmaiseksi 200 tokenilla per sykli.