Cómo Funciona anonym.legal

Detección de PII determinista basada en regex que ofrece resultados 100% reproducibles. La misma entrada, la misma salida—siempre. Sin IA, sin conjeturas, solo coincidencia de patrones transparente.

How Does PII Detection Work?

PII detection identifies personal data in text using pattern matching and machine learning. anonym.legal uses a hybrid approach:

  1. 1
    Pattern Matching: Regex patterns detect structured data (SSNs, credit cards, IBANs) with checksum validation.
  2. 2
    Named Entity Recognition: NER models identify names, locations, and organizations in 48 languages.
  3. 3
    Context Scoring: Each detection is scored based on surrounding context to minimize false positives.

This hybrid approach detects 285+ entity types while maintaining deterministic, reproducible results — essential for compliance and legal discovery.

¿Por Qué Regex, No IA?

Nuestro Enfoque

  • Resultados 100% reproducibles
  • Totalmente auditable para cumplimiento
  • No se requieren datos de entrenamiento
  • Toma de decisiones transparente
  • Rendimiento rápido y predecible
  • Sin deriva de modelo con el tiempo

Enfoques de IA/ML

  • Los resultados varían entre ejecuciones
  • Toma de decisiones en caja negra
  • Requiere datos de entrenamiento
  • Difícil de auditar
  • Costos de computación más altos
  • Deriva de modelo con el tiempo

El Proceso de 10 Pasos

Desde la entrada hasta la salida, aquí está exactamente lo que sucede con su documento

1

Texto de Entrada

Envía tu documento a través de la interfaz web, API o complemento de Office

2

Detección de Idioma

El sistema identifica el idioma del documento para un procesamiento óptimo

3

Tokenización

El texto se divide en tokens para la coincidencia de patrones

4

Coincidencia de Patrones

Los patrones de regex escanean más de 50 tipos de entidades

5

Análisis de Contexto

El texto circundante mejora la precisión de la detección

6

Puntuación de Confianza

Cada detección recibe una puntuación de confianza

7

Clasificación de Entidades

Los elementos detectados se categorizan por tipo

8

Revisar Resultados

Vea todas las detecciones con posiciones y puntuaciones

9

Aplicar Anonimización

Elija su método: Reemplazar, Redactar, Hash, Cifrar o Enmascarar

10

Documento de Salida

Descargue su documento anonimizado

Disponible solo en planes Pro y Business

Servidor MCP: Integración de IA con Enfoque en la Privacidad

Cómo fluyen sus datos a través del Servidor MCP para mantener seguros los herramientas de IA

1

Solicitud de Herramienta de IA

Su herramienta de IA (Cursor, Claude) envía una solicitud que contiene PII

2

El Servidor MCP Intercepta

El servidor analiza y detecta todas las entidades PII

3

Anonimización

La PII se reemplaza con tokens o se redacta

Safe data only
4

Procesamiento de IA

La IA recibe y procesa solo datos anonimados

5

Devolución de Respuesta

La respuesta de IA regresa a través del Servidor MCP

6
Optional

Detokenización

Opcional: Valores originales restaurados para el usuario

Ejemplo del Mundo Real

Antes (con PII)
Procesar pago para John Doe, correo john@example.com, tarjeta 4532-1111-2222-3333

Lo que ve la IA

Después (anonimizado)
Procesar pago para PII_PERSON_001, correo PII_EMAIL_001, tarjeta PII_CREDIT_CARD_001

Lo que recibe de vuelta

La IA nunca ve su PII real
Reversible con modo de tokenización
Los mismos costos de token que la aplicación web
Funciona con múltiples herramientas de IA
Seguridad de nivel empresarial

Frequently Asked Questions

Why use regex instead of AI for PII detection?

Regex-based detection is deterministic and reproducible. The same input always produces the same output. AI/ML models can be unpredictable and may miss or falsely flag data. For compliance, reproducibility matters.

How accurate is the detection?

Our hybrid approach combines regex patterns with Named Entity Recognition (NER) for high accuracy. All patterns include checksum validation where applicable (credit cards, IBANs, SSNs). False positives are minimized through context-aware scoring.

What happens to my data during processing?

Text is sent to our EU-hosted servers (Hetzner, Germany) over TLS 1.3 for analysis. We don't store your data after processing. With Zero-Knowledge auth, we can't even identify which user made the request.

Can I add custom entity types?

Yes! You can create custom recognizers with your own regex patterns and context words. Custom entities support the same operators (replace, mask, hash, encrypt, redact) as built-in types.

How does reversible encryption work?

The Encrypt operator uses AES-256-GCM encryption with your key. Only you can decrypt. This allows re-identification for audits or legal discovery while keeping data protected in transit and storage.

Véalo en Acción

Pruebe nuestra detección y anonimización de PII gratis con 200 tokens por ciclo.