Proč regulární výrazy, ne AI?
Pro regulativní shodu potřebujete výsledky, které můžete vysvětlit a reprodukovat. Náš deterministický přístup poskytuje přesně to - žádné černé skříňky, žádná překvapení.
Podrobná srovnání
We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.
| Entity Type | Detection Method | Examples |
|---|---|---|
| Strukturovaná data | Regex vzory | E-maily, SSN, kreditní karty, IBAN, telefonní čísla |
| Jména a organizace | ML modely (spaCy, Stanza) | Jména osob, názvy společností, místa |
| 48 jazyků | XLM-RoBERTa | Rozpoznávání entit napříč jazyky |
| Reprodukovatelnost | 100% reprodukovatelné | Stejný vstup = stejný výstup, pokaždé |
| Detekce jmen | Vysoká přesnost ML | Ověřené NLP modely s hodnotami důvěry |
| Auditovatelnost | +Plně auditovatelné | Pozice, typ, důvěra pro každou entitu |
Jak funguje shoda vzorů
Každý typ entity má pečlivě vytvořené regulární výrazy, které odpovídají specifickým formátům.
E-mailové adresy
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}Odpovídá standardnímu formátu e-mailu: místní-část@doména.tld
Čísla kreditních karet
\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\bOdpovídá formátům Visa, Mastercard, Amex a dalších karet s validací Luhn
Německý IBAN
DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}Odpovídá německému formátu IBAN s volitelnými mezerami
Vytvořeno pro shodu
Když auditoři se ptají "proč bylo toto detekováno?" potřebujete jasnou odpověď. Náš přístup na základě regulárních výrazů poskytuje přesně to.
- GDPR článek 25: Ochrana soukromí od začátku s vysvětlitelným zpracováním
- ISO 27001: Dokumentované, opakovatelné procesy
- Auditní stopa: Každá detekce může být sledována k určitému vzoru
Příklad auditní odpovědi
Zažijte deterministickou detekci
Vyzkoušejte naši detekci PII na základě regulárních výrazů zdarma s 200 tokeny na cyklus.