Kuinka anonym.legal toimii
Deterministinen, regex-pohjainen PII-tunnistus, joka tuottaa 100 % toistettavia tuloksia. Sama syöte, sama tulos—joka kerta. Ei AI:ta, ei arvailua, vain läpinäkyvää kaavojen vertailua.
How Does PII Detection Work?
PII detection identifies personal data in text using pattern matching and machine learning. anonym.legal uses a hybrid approach:
- 1Pattern Matching: Regex patterns detect structured data (SSNs, credit cards, IBANs) with checksum validation.
- 2Named Entity Recognition: NER models identify names, locations, and organizations in 48 languages.
- 3Context Scoring: Each detection is scored based on surrounding context to minimize false positives.
This hybrid approach detects 285+ entity types while maintaining deterministic, reproducible results — essential for compliance and legal discovery.
Miksi Regex, ei AI?
Meidän lähestymistapamme
- 100 % toistettavat tulokset
- Täysin auditoitavissa oleva vaatimustenmukaisuus
- Ei koulutusdataa vaadita
- Läpinäkyvä päätöksenteko
- Nopea, ennustettava suorituskyky
- Ei mallin siirtymistä ajan myötä
AI/ML-lähestymistavat
- Tulokset vaihtelevat suoritusten välillä
- Musta laatikko -päätöksenteko
- Vaatii koulutusdataa
- Vaikea auditoida
- Korkeammat laskentakustannukset
- Mallin siirtyminen ajan myötä
10-vaiheinen prosessi
Syötteestä tulokseen, tässä on tarkalleen mitä tapahtuu asiakirjallesi
Syöte
Lähetä asiakirjasi verkkoliittymän, API:n tai Office-lisäosan kautta
Kielentunnistus
Järjestelmä tunnistaa asiakirjan kielen optimaalista käsittelyä varten
Tokenisointi
Teksti jaetaan tokeneiksi kaavojen vertailua varten
Kaavojen vertailu
Regex-kaavat skannaavat yli 50 entiteettityyppiä
Kontekstianalyysi
Ympäröivä teksti parantaa tunnistustarkkuutta
Luottamuspisteytys
Jokainen tunnistus saa luottamuspisteen
Entiteettiluokittelu
Tunnistetut kohteet luokitellaan tyypin mukaan
Tulosten tarkistus
Näe kaikki tunnistukset sijainteineen ja pisteineen
Sovella anonymisointia
Valitse menetelmäsi: Korvata, Poistaa, Hash, Salata tai Peittää
Tulostusasiakirja
Lataa anonymisoitu asiakirjasi
MCP-palvelin: Tietosuojaan keskittyvä AI-integraatio
Kuinka tietosi kulkevat MCP-palvelimen läpi pitääkseen AI-työkalut turvallisina
AI-työkalun pyyntö
AI-työkalusi (Cursor, Claude) lähettää pyynnön, joka sisältää PII:t
MCP-palvelin keskeyttää
Palvelin analysoi ja tunnistaa kaikki PII-entiteetit
Anonymisointi
PII korvataan tokeneilla tai poistetaan
AI-käsittely
AI vastaanottaa ja käsittelee vain anonymisoituja tietoja
Vastauksen palautus
AI-vastaus tulee takaisin MCP-palvelimen kautta
De-tokenisointi
Valinnainen: Alkuperäiset arvot palautetaan käyttäjälle
Reaalimaailman esimerkki
Käsittele maksua John Doelle, sähköposti john@example.com, kortti 4532-1111-2222-3333Mitä AI näkee
Käsittele maksua PII_PERSON_001, sähköposti PII_EMAIL_001, kortti PII_CREDIT_CARD_001Mitä saat takaisin
Frequently Asked Questions
Why use regex instead of AI for PII detection?
Regex-based detection is deterministic and reproducible. The same input always produces the same output. AI/ML models can be unpredictable and may miss or falsely flag data. For compliance, reproducibility matters.
How accurate is the detection?
Our hybrid approach combines regex patterns with Named Entity Recognition (NER) for high accuracy. All patterns include checksum validation where applicable (credit cards, IBANs, SSNs). False positives are minimized through context-aware scoring.
What happens to my data during processing?
Text is sent to our EU-hosted servers (Hetzner, Germany) over TLS 1.3 for analysis. We don't store your data after processing. With Zero-Knowledge auth, we can't even identify which user made the request.
Can I add custom entity types?
Yes! You can create custom recognizers with your own regex patterns and context words. Custom entities support the same operators (replace, mask, hash, encrypt, redact) as built-in types.
How does reversible encryption work?
The Encrypt operator uses AES-256-GCM encryption with your key. Only you can decrypt. This allows re-identification for audits or legal discovery while keeping data protected in transit and storage.
Näe se toiminnassa
Kokeile PII-tunnistustamme ja anonymisointiamme ilmaiseksi 200 tokenilla per sykli.