By · Last updated 2026-06-15

Enterprise NLP vs. Regex

anonym.legal vs Caviard.ai

Caviard.ai Chrome hedapena da regex patroiak PII hautemakerako erabiliz, % 60–75 gogorra % 15–30 faltsu positiboen ehunekoa loruz — ez dago ustez erregulaturiko akordiorako dago. anonym.legal-ren 3-geruza NLP motorra % 92–98 gogorra 48 hizkuntzaetan loruz deterministic, itsulgarri emaitzakz web, desktop, Office Add-in eta browser guztietan.

Gehiago jakin Caviard.ai

Ezaugarrien konparazioa

Ezaugarriaanonym.legalCaviard.ai
Hautematze teknologiaYesRegex patroiak soilik
Subjektu motak285+~ 30–50 patroiak
Hizkuntza babesa48 languagesMugatua (regex hutsuneak non-ASCII)
Plataforma babesaYesChrome hedapena soilik
Konfiantza puntuazioa subjekukoYesEz
Deterministic emaitzakYesPatroiaren oinarritua soilik
Gogorra tasaYes% 60–75
Faltsu positiboen tasaYes% 15–30
ISO 27001YesEz dokumentatua
Akordio auditoria trazakYesEz
Alderantzigarria kodifikazioaAES-256-GCMEz (browser lokala prozesatze)
Office gehituYesEz
PrezioaFree to €29/moEz argitaratua

Konparazioa publikoan eskuragarri dagoen informazioan oinarritzen da. "Ez da aurkitu" produktuaren orrian dokumentatuta ez dagoen ezaugarria adierazten du. Azken eguneraketa: 2026ko otsaila.

Zergatik aukeratu anonym.legal

Browser guztiak + Desktop — Biak ez Chrome soilik

anonym.legal Chrome-n, Firefox-n, Edge-n, Safari-n eta desktop aplikazio gisa funtzionatzen du. Caviard.ai Chrome hedapena da — beste browser batzuk erabiltzen dituzten langilea ez dute babesik.

Deterministic NLP vs. Regex Patroiak

anonym.legal 3-geruza NLP erabiliz (Presidio + spaCy + XLM-RoBERTa transformazioak). Regex ezin du testuingurua ulertu: kokapenaren subjetuak galditzen ditu, enpresen izenak testua nahasteta non-ASCII script guztietan huts egiten du.

ISO 27001 ziurtatutako azpiegitura

anonym.legal Hetzner Alemania-n exekutatzen da ISO 27001 ziurtagariekin. Caviard.ai argitaraturiko segurtasun ziurtagiriak ez ditu.

48 hizkuntza vs. Regex hutsuneak

Regex-oinarritua hautematze Alemania umlauts, arabiera, txinera, hebreera eta non-ASCII karaktere batzuk huts. anonym.legal-ren NLP 48 hizkuntza beren aldetik estalten ditu.

Konfiantza puntuazioa subjekuko

Detektio bakoitzak % 0–100 konfiantza puntuazioa eta araua/eredua aktibatua — legezko defenditzailerako eta HIPAA auditorietzako beharrezkoa. Caviard.ai konfiantza puntuaziorik ez du.

285+ subjektu motak

Herrialde-zehatza IDak egiaztatze batura bidez, NER 48 hizkuntzaetan, mediku kartarei zenbakiak, finantza identifikadoreak. Caviard.ai ~ 30–50 regex patroiak estalten ditu.

anonym.legal aukeratzearen denboran

anonym.legal Caviard.ai baten beste badute noiz:

  • Compliance mailaren gogorra (% 92–98) beharrezkoak ditu oinarria patroiaren parekotasun ordez (% 60–75)
  • Zure taleak Firefox, Edge, Safari edo desktop aplikazioak erabiltzen ditu — Chrome soilik ez
  • Hainbat hizkuntza edukia prozesatzen duzu: Alemania, Frantziar, Arabiar, Txinera, Hebreera edo 48 hizkuntzaez beste
  • Subjekuko konfiantza puntuazioa eta auditorietan HIPAA, GDPR edo e-discovery beharrezkoak
  • Alderantzigarria anonimizazioa beharrezkoa — deskodetu ordezleak legeak eskatzen duenean

Maiz Egindako Galderak

Zein aldea dago regex-oinarritua eta NLP-oinarritua PII hautematzearen artean?

Regex patroiak testu egitura finkoak hompatzen ditu (adb. SSN formatua). Kontestuaren mende PII galditzen dute: esaldietan izenak, kokapenaren subjetuak eta patroiak pixka bat aldatzeari. NLP ereduak hizkuntza testuingurua ulertzen dute — anonym.legal-ren 3-geruza tutza (Presidio + spaCy + XLM-RoBERTa) % 92–98 gogorra loruz vs. % 60–75 regex-soilik Caviard.ai baten gauza.

Caviard.ai Firefox, Edge edo Safari-n funtzionatzen du?

Ez. Caviard.ai Chrome hedapena da eta Chrome-oinarritua browser-tan soilik funtzionatzen du. anonym.legal web aplikazioan hondar browser guztietan funtzionatzen du, Chrome eta Edge hedapen bereziak ematen ditu eta Windows, macOS eta Linux desktop aplikazio independentea hartuz.

Zein segurtasun ziurtagiriak Caviard.ai?

Caviard.ai ISO 27001 edo SOC 2 ziurtagiriak ez ditu argitaratzen. anonym.legal Hetzner Alemania azpiegitura ISO 27001 ziurtagariekin funtzionatzen da, GDPR-ari zerikusia duten datuak prozesatzeko akordioak eta zero-knowledge autentifikazioa independentea segurtasun auditoriaz egiaztatua.

anonym.legal Caviard.ai galditzen duen hainbat hizkuntza PII nola kudeatzen du?

Regex patroiak non-ASCII karakteretan huts egiten du: Alemania umlauts (ä, ö, ü), arabier idazketa, txinera karaktereak, hebreera letrak. anonym.legal-ren NLP ereduak 48 hizkuntzaetan prestaturik dago eta karaktereen normalizazioa, Unicode mugiaren eta hizkuntza-zehatza ID formatua kudeatzen ditu.

Zein faltsu positiboen ehunekoa espero ditzake?

Caviard.ai regex ikuspegia % 15–30 faltsu positiboen ehunekoak sortzen du — non-PII testua sentigarria duten. Hau kitzikaturiko eduki legala duten kalte baten beharrezkoa du. anonym.legal-ren NLP tutza faltsu positiboak % 5 aldean txikitu dute kontestuaren adimenduaren bidez, konfiantza puntuazioaren atarpeak eta subjekuko ordezkatze kontrolak.

anonym.legal auditoria trazak ematen ditu akordiorako?

Bai. Detektio bakoitzak subjektu mota, konfiantza puntuazioa, hautematze metodoa (arau IDa edo ereduaren izena) eta denbora zigilua hartzen du — HIPAA, GDPR eta e-discovery eskarientzako auditorian trazak ezarri. Caviard.ai detektioko auditorian trazak ez du ematen.

Enterprise NLP PII hautematze

% 92–98 gogorra. 48 hizkuntza. Browser guztiak + Desktop. ISO 27001. Doako hasiera.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.