Prečo regex, nie AI?
Pre regulatórny súlad potrebujete výsledky, ktoré môžete vysvetliť a reprodukovať. Náš deterministický prístup poskytuje presne to - žiadne čierne skrinky, žiadne prekvapenia.
Podrobná porovnanie
We use the best tool for each job: deterministic regex patterns for structured data, and proven ML models for names and entities. Built on Microsoft Presidio.
| Entity Type | Detection Method | Examples |
|---|---|---|
| Štruktúrované dáta | Regex vzory | E-maily, SSN, kreditné karty, IBAN, telefónne čísla |
| Mená a organizácie | ML modely (spaCy, Stanza) | Mená osôb, názvy spoločností, lokality |
| 48 jazykov | XLM-RoBERTa | Rozpoznávanie entít naprieč jazykmi |
| Reprodukovateľnosť | 100% reprodukovateľné | Rovnaký vstup = rovnaký výstup, vždy |
| Detekcia mien | Vysoká presnosť ML | Overené NLP modely s hodnotami dôvery |
| Audítovateľnosť | +Úplne auditovateľné | Poloha, typ, dôvera pre každú entitu |
Ako funguje porovnávanie vzorov
Každý typ entity má starostlivo vytvorené regex vzory, ktoré zodpovedajú konkrétnym formátom.
Emailové adresy
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}Zodpovedá štandardnému formátu emailu: local-part@domain.tld
Čísla kreditných kariet
\b(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|...)\bZodpovedá Visa, Mastercard, Amex a iným formátom kariet s validáciou Luhn
Nemecký IBAN
DE[0-9]{2}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{4}\s?[0-9]{2}Zodpovedá formátu nemeckého IBAN s voliteľnými medzerami
Navrhnuté pre súlad
Keď audítori sa pýtajú "prečo bolo toto detekované?" potrebujete jasnú odpoveď. Náš prístup na báze regexu poskytuje presne to.
- GDPR článok 25: Ochrana súkromia pri návrhu s vysvetliteľným spracovaním
- ISO 27001: Dokumentované, opakovateľné procesy
- Auditná stopa: Každá detekcia môže byť sledovaná k špecifickému vzoru
Príklad odpovede na audit
Zažite deterministickú detekciu
Vyskúšajte našu detekciu PII na báze regexu zadarmo s 200 tokenmi na cyklus.