By · Last updated 2026-06-15

エンタープライズNLP対正規表現

anonym.legal vs Caviard.ai

Caviard.aiはPII検出に正規表現パターンを使用するChrome拡張機能で、60~75%の再現率と15~30%の偽陽性率を達成しています。これは規制コンプライアンス作業には不十分です。anonym.legalの3層NLPエンジンは、ウェブ、デスクトップ、Office Add-in、およびすべてのブラウザで48言語にわたって92~98%の再現率を配信し、決定論的で監査可能な結果を提供します。

詳細を見る: Caviard.ai

機能比較

機能anonym.legalCaviard.ai
検出テクノロジーYes正規表現パターンのみ
エンティティタイプ285+約30~50パターン
言語サポート48 languages制限付き(非ASCII正規表現ギャップ)
プラットフォームサポートYesChrome拡張機能のみ
エンティティごとの信頼度スコアリングYesいいえ
決定論的結果Yesパターンベースのみ
再現率Yes60~75%
偽陽性率Yes15~30%
ISO 27001Yes記載なし
コンプライアンス監査証跡Yesいいえ
可逆暗号化AES-256-GCMいいえ(ローカルブラウザ処理)
Office Add-inYesいいえ
価格設定Free to €29/mo未公開

本比較は公開情報に基づいています。「記載なし」は製品ページに機能の記載がないことを示します。最終更新:2026年2月。

anonym.legal を選ぶ理由

すべてのブラウザ+デスクトップ – Chrome限定ではない

anonym.legalはChrome、Firefox、Edge、Safari、およびデスクトップアプリで機能します。Caviard.aiはChrome拡張機能です。他のブラウザを使用するスタッフには保護がありません。

決定論的NLP対正規表現パターン

anonym.legalは3層NLP(Presidio + spaCy + XLM-RoBERTa変換器)を使用しています。正規表現は文脈を理解できません。位置エンティティを見逃し、会社名をテキストと混同し、すべての非ASCII文字で失敗します。

ISO 27001認定インフラストラクチャ

anonym.legalはISO 27001認定のドイツ・ヘッツナー上で実行されます。Caviard.aiは記載されたセキュリティ認証がありません。

48言語対正規表現の欠陥

正規表現ベースの検出は、ドイツのウムラウト、アラビア語、中国語、ヘブライ語、および他の非ASCII文字で失敗します。anonym.legalの多言語NLPは48言語をネイティブにカバーしています。

エンティティごとの信頼度スコアリング

すべての検出には0~100%の信頼度スコアと、それをトリガーしたルール/モデルが含まれています。これは法的防御可能性とHIPAA監査証跡に必要です。Caviard.aiは信頼度スコアを提供しません。

285+ エンティティタイプ

チェックサム検証付きの国固有ID、48言語NER、医療記録番号、金融識別子。Caviard.aiは約30~50の正規表現パターンをカバーしています。

anonym.legalが適切な選択である場合

anonym.legalはCaviard.aiを上回る場合:

  • 基本的なパターンマッチング(60~75%)ではなく、コンプライアンスグレードの再現率(92~98%)が必要な場合
  • あなたのチームがChromeのみではなく、Firefox、Edge、Safari、またはデスクトップアプリケーションを使用している場合
  • 多言語コンテンツを処理する場合:ドイツ語、フランス語、アラビア語、中国語、ヘブライ語、または48言語のいずれか
  • HIPAA、GDPR、またはeディスカバリーのエンティティごとの信頼度スコアと監査証跡が必要な場合
  • 可逆的な匿名化が必要な場合 – 法的要件で必要な場合はプレースホルダーを復号化する場合

よくあるご質問

正規表現ベースとNLPベースのPII検出の違いは何ですか?

正規表現パターンは固定テキスト構造(例:SSN形式)と一致します。文脈に依存するPIIを見逃します。文内の名前、位置エンティティ、およびわずかに変わるパターン。NLPモデルは言語文脈を理解します。anonym.legalの3層パイプライン(Presidio + spaCy + XLM-RoBERTa)は、Caviard.aiのような正規表現のみのツールで92~98%の再現率対60~75%を達成します。

Caviard.aiはFirefox、Edge、またはSafariで機能しますか?

いいえ。Caviard.aiはChrome拡張機能で、Chromeベースのブラウザーでのみ機能します。anonym.legalはWebアプリを介してすべての主要ブラウザーで機能し、Chrome用とEdge用の専用拡張機能を提供し、Windows、macOS、およびLinux用のスタンドアロンデスクトップアプリを含みます。

Caviard.aiはどのようなセキュリティ認証を持っていますか?

Caviard.aiはISO 27001またはSOC 2認証を公開していません。anonym.legalはISO 27001認定のドイツ・ヘッツナーインフラストラクチャ上で実行され、GDPR準拠のデータ処理契約、および独立したセキュリティ監査によって検証されたゼロナレッジ認証があります。

anonym.legalはCaviard.aiが見落とす多言語PIIをどのように処理しますか?

正規表現は非ASCII文字で失敗します:ドイツのウムラウト(ä、ö、ü)、アラビア文字、中国語文字、ヘブライ文字。anonym.legalのNLPモデルは48言語でトレーニングされており、文字正規化、Unicode境界、および言語固有のID形式(ドイツ国民身分証、フランスNIR、アラビア国民ID等)を処理しています。

どの程度の偽陽性率が期待できますか?

Caviard.aiの正規表現アプローチは15~30%の偽陽性率を生成します。非PIIテキストを機密とフラグを立て、正当なコンテンツの不要な削除を作成します。anonym.legalのNLPパイプラインは、文脈的理解、信頼度スコアリング閾値、およびエンティティごとのオーバーライド制御を通じて、偽陽性を5%未満に削減しています。

anonym.legalはコンプライアンス監査証跡を提供していますか?

はい。すべての検出には、エンティティ型、信頼度スコア、検出方法(ルールIDまたはモデル名)、およびタイムスタンプが含まれています。HIPAA、GDPR、およびeディスカバリー要件のための防御可能な監査証跡を作成します。Caviard.aiは検出ごとの監査証跡を提供しません。

エンタープライズNLP PII検出

92~98%再現率。48言語。すべてのブラウザ+デスクトップ。ISO 27001。無料で開始。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.