By · Last updated 2026-06-15

Enterprise-NLP vs. Regex

anonym.legal vs Caviard.ai

Caviard.ai ist eine Chrome-Erweiterung, die Regex-Muster für PII-Erkennung verwendet und eine Recall-Rate von 60–75% mit 15–30% False-Positive-Rate erreicht – unzureichend für regulierte Compliance-Arbeiten. Die 3-Schicht-NLP-Engine von anonym.legal liefert 92–98% Recall über 48 Sprachen hinweg mit deterministischen, prüfbaren Ergebnissen im Web, auf dem Desktop, in der Office-Add-in und in allen Browsern.

Mehr erfahren über Caviard.ai

Funktionsvergleich

Funktionanonym.legalCaviard.ai
ErkennungstechnologieYesNur Regex-Muster
Entity-Typen285+~30–50 Muster
Sprachunterstützung48 languagesBegrenzt (Regex-Lücken bei Nicht-ASCII)
PlattformunterstützungYesNur Chrome-Erweiterung
Konfidenzscoring pro EntityYesNein
Deterministische ErgebnisseYesNur Pattern-basiert
Recall-RateYes60–75%
False-Positive-RateYes15–30%
ISO 27001YesNicht dokumentiert
Compliance-Audit-TrailYesNein
Umkehrbare VerschlüsselungAES-256-GCMNein (lokale Browser-Verarbeitung)
Office-Add-inYesNein
PreisgestaltungFree to €29/moNicht veröffentlicht

Vergleich basiert auf öffentlich verfügbaren Informationen. "Nicht gefunden" bedeutet, dass die Funktion auf der Produktseite nicht dokumentiert ist. Letzte Aktualisierung: Februar 2026.

Warum anonym.legal wählen

Alle Browser + Desktop – Nicht nur Chrome

anonym.legal funktioniert in Chrome, Firefox, Edge, Safari und als Desktop-App. Caviard.ai ist eine Chrome-Erweiterung – Mitarbeiter, die andere Browser verwenden, erhalten keinen Schutz.

Deterministische NLP vs. Regex-Muster

anonym.legal verwendet 3-Schicht-NLP (Presidio + spaCy + XLM-RoBERTa Transformer). Regex kann Kontext nicht verstehen: es übersieht Location-Entities, verwechselt Unternehmensamen mit Text und schlägt bei allen Nicht-ASCII-Skripten fehl.

ISO-27001-zertifizierte Infrastruktur

anonym.legal läuft auf Hetzner Deutschland mit ISO-27001-Zertifizierung. Caviard.ai hat keine dokumentierten Sicherheitszertifizierungen.

48 Sprachen vs. Regex-Lücken

Regex-basierte Erkennung schlägt bei deutschen Umlauten, Arabisch, Chinesisch, Hebräisch und anderen Nicht-ASCII-Zeichen fehl. Die mehrsprachige NLP von anonym.legal deckt 48 Sprachen nativ ab.

Konfidenzscores pro Entity

Jede Erkennung enthält einen 0–100%-Konfidenz-Score und die Regel/das Modell, die sie ausgelöst haben – erforderlich für rechtliche Verteidigbarkeit und HIPAA-Audit-Trails. Caviard.ai bietet keine Konfidenzscores.

285+ Entity-Typen

Länder-spezifische IDs mit Checksummen-Validierung, 48-Sprachen-NER, medizinische Akten-Nummern, Finanzidentifikatoren. Caviard.ai deckt ~30–50 Regex-Muster ab.

Wenn anonym.legal die richtige Wahl ist

anonym.legal übertrifft Caviard.ai, wenn:

  • Sie Compliance-Grade-Recall (92–98%) benötigen, nicht nur einfaches Pattern Matching (60–75%)
  • Ihr Team Firefox, Edge, Safari oder Desktop-Anwendungen verwendet – nicht nur Chrome
  • Sie mehrsprachige Inhalte verarbeiten: Deutsch, Französisch, Arabisch, Chinesisch, Hebräisch oder eine beliebige der 48 Sprachen
  • Sie Konfidenzscores pro Entity und Audit-Trails für HIPAA, DSGVO oder E-Discovery benötigen
  • Sie umkehrbare Anonymisierung benötigen – Platzhalter entschlüsseln, wenn gesetzlich erforderlich

Häufig gestellte Fragen

Was ist der Unterschied zwischen Regex-basierter und NLP-basierter PII-Erkennung?

Regex-Muster entsprechen festen Textstrukturen (z.B. SSN-Format). Sie verpassen kontextabhängige PII: Namen in Sätzen, Location-Entities und alle Muster, die sich leicht unterscheiden. NLP-Modelle verstehen Sprachkontext – die 3-Schicht-Pipeline von anonym.legal (Presidio + spaCy + XLM-RoBERTa) erreicht 92–98% Recall vs. 60–75% für Regex-Only-Tools wie Caviard.ai.

Funktioniert Caviard.ai in Firefox, Edge oder Safari?

Nein. Caviard.ai ist eine Chrome-Erweiterung und funktioniert nur in Chrome-basierten Browsern. anonym.legal funktioniert in allen großen Browsern über die Web-App, bietet dedizierte Chrome- und Edge-Erweiterungen und beinhaltet eine eigenständige Desktop-App für Windows, macOS und Linux.

Welche Sicherheitszertifizierungen hat Caviard.ai?

Caviard.ai veröffentlicht keine ISO-27001- oder SOC-2-Zertifizierungen. anonym.legal läuft auf Hetzner-Deutschland-Infrastruktur mit ISO-27001-Zertifizierung, DSGVO-konformen Datenverarbeitungsvereinbarungen und Zero-Knowledge-Authentifizierung, verifiziert durch unabhängige Sicherheitsaudits.

Wie behandelt anonym.legal mehrsprachige PII, die Caviard.ai übersieht?

Regex-Muster schlagen bei Nicht-ASCII-Zeichen fehl: deutsche Umlaute (ä, ö, ü), arabische Schrift, chinesische Zeichen, hebräische Buchstaben. Die NLP-Modelle von anonym.legal sind für 48 Sprachen trainiert und verarbeiten Zeichennormalisierung, Unicode-Grenzen und sprachspezifische ID-Formate (deutscher Personalausweis, französische NIR, arabische nationale IDs usw.).

Mit welchen False-Positive-Raten kann ich rechnen?

Der Regex-Ansatz von Caviard.ai erzeugt 15–30% False-Positive-Raten – kennzeichnet Nicht-PII-Text als sensibel. Dies führt zu unnötiger Redaktion legitimer Inhalte. Die NLP-Pipeline von anonym.legal reduziert False Positives auf unter 5% durch kontextuelle Verständnis, Konfidenz-Schwellenwerte und Pro-Entity-Override-Kontrollen.

Bietet anonym.legal Audit-Trails zur Compliance?

Ja. Jede Erkennung enthält den Entity-Typ, Konfidenz-Score, Erkennungsmethode (Regel-ID oder Modellname) und Zeitstempel – erstellt einen verteidigbaren Audit-Trail für HIPAA-, DSGVO- und E-Discovery-Anforderungen. Caviard.ai bietet keine Pro-Detection-Audit-Trails.

Enterprise-NLP-PII-Erkennung

92–98% Recall. 48 Sprachen. Alle Browser + Desktop. ISO 27001. Kostenlos starten.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.