By · Last updated 2026-06-05

Volver al BlogTécnico

Por qué la detección binaria de PII está fallando a...

Detectado/no detectado es insuficiente para contextos de cumplimiento que requieren juicio humano.

June 5, 20268 min de lectura
confidence scoringPII detectionlegal discoverycomplianceGDPR audit

title: "Por qué la detección binaria de DCP falla en cumplimiento" description: "Los indicadores detectado/no-detectado no bastan para decisiones de redacción defendibles. El scoring de confianza transforma la anonimización de DCP de una suposición binaria en un control de cumplimiento auditable." category: technical publishedAt: 2026-06-21 tags:

  • scoring de confianza
  • detección de DCP
  • discovery legal
  • cumplimiento
  • auditoría RGPD readingTime: 8

Por qué la detección binaria de DCP falla en cumplimiento

Actualizado para 2026

Toda herramienta de detección de datos de carácter personal (DCP) enfrenta un problema central. La misma cadena puede ser un dato personal en un contexto y no en otro.

"Juan" en un archivo de cliente es un interesado. "Juan" en un texto histórico sobre Juan Pablo II no lo es. Un número de nueve dígitos en un historial médico es un identificador HIPAA. Los mismos nueve dígitos en un código de producto no lo son.

Un indicador sí/no no puede manejar esto. Impone dos malas opciones: redactar todas las cadenas que podrían ser DCP, o redactar solo las coincidencias seguras. Ambas fallan en el derecho, donde cada decisión debe ser clara y documentada.

Una puntuación de 0 a 100 por entidad ofrece un tercer camino. Impulsa reglas escalonadas, colas de revisión humana y registros de auditoría completos.

El límite de los indicadores sí/no

El contexto cambia el significado de los datos. Dos archivos pueden contener la misma cadena. En uno, son datos personales. En el otro, no. Un indicador no puede mostrar eso. Un número sí puede.

Con solo un indicador, sus dos opciones son malas. La sobre-redacción destruye el valor del documento. La sub-redacción crea riesgo legal. Ninguna resiste en un tribunal.

El discovery legal tiene reglas que hacen obligatoria la detección con puntuación.

El problema de la sobre-redacción. Redactar nombres de abogados o citas judiciales daña las pruebas. Los tribunales han sancionado a abogados por sobre-redacción. La misma jurisprudencia que cubre la sub-redacción aplica aquí también.

El problema de la sub-redacción. No detectar DCP reales crea riesgo. Eso incluye violaciones de la privacidad del cliente, quejas ante el colegio de abogados y, en algunos lugares, cargos penales.

La necesidad de explicar cada decisión. Cuando un tribunal pregunta por qué se redactó un elemento, los abogados deben explicarlo. "La herramienta lo marcó" no es suficiente. "La herramienta puntuó esto al 94 % como número de seguridad social. Nuestra regla redacta automáticamente por encima del 85 %." Eso sí es suficiente.

Un indicador sí/no no puede dar esa respuesta. Una herramienta con puntuación y reglas definidas sí puede. Vea también: Defender redacciones: puntuaciones de IA en los tribunales.

Un sistema de revisión en tres niveles

La configuración más efectiva usa tres niveles basados en la puntuación de la entidad.

Nivel 1 — Automático (por encima del 85 %):

  • Elementos que coinciden con formatos de alta certeza (SSN, IBAN, MRN)
  • Redactados automáticamente sin paso humano
  • El registro captura tipo de entidad, puntuación, método y hora
  • Ejemplo: "571-44-9283" al 97 % como SSN — redactado automáticamente

Nivel 2 — Revisión humana (50–85 %):

  • Elementos que pueden ser DCP pero requieren un juicio de valor
  • Enviados a un revisor para aceptar, rechazar o reclasificar
  • El registro captura tipo de entidad, puntuación, ID del revisor, decisión y hora
  • Ejemplo: "Juan García" en un doc técnico al 67 % — el revisor confirma que es un nombre — redactado

Nivel 3 — Solo sugerencia (por debajo del 50 %):

  • Elementos de baja certeza mostrados como sugerencias
  • No redactados automáticamente; el revisor puede actuar u omitir
  • El registro captura tipo de entidad, puntuación y decisión del revisor
  • Ejemplo: "García" en un documento de producto al 42 % — el revisor determina que es un nombre de empresa — no redactado

Solo el Nivel 2 requiere trabajo humano. Los tres niveles producen registros de auditoría.

Cómo se construyen las puntuaciones

Las herramientas de DCP combinan señales para producir un número por entidad.

Patrones regex. Una coincidencia exacta con el formato SSN obtiene una puntuación base alta. Una coincidencia parcial obtiene una más baja.

Salida del modelo. Los modelos de reconocimiento de entidades nombradas asignan una probabilidad por clase. Una puntuación de 0,93 para PERSONA produce una detección de alta certeza.

Señales de contexto. El texto alrededor de la entidad ajusta la puntuación. "Mi SSN es 571-44-9283" la sube. "Código de producto 571-44-9283" la baja.

Reglas de conjunto. Los sistemas combinan señales regex, de modelo y de contexto con pesos definidos. El número final refleja toda la evidencia disponible.

Ese número impulsa cada decisión de umbral en su flujo de trabajo. Para más sobre falsos positivos en herramientas sí/no: El impuesto de falsos positivos en herramientas de DCP.

Siniestros de seguros: un ejemplo real

Los archivos de seguros mezclan DCP claras — nombre del asegurado, dirección, número de seguridad social — con datos dependientes del contexto: nombres de testigos, nombres de empresas, firmas de peritos.

Una herramienta sí/no redacta todos los nombres (incorrecto para empresas) o pasa por alto los nombres de testigos (un riesgo). Una herramienta con puntuación trata cada elemento por separado:

  • SSN con etiqueta "policyholder SSN" al 96 % — redactado automáticamente
  • Nombre del asegurado, marcado PERSONA, al 91 % — redactado automáticamente
  • Empresa contratista, marcada ORG, al 78 % — revisada — el revisor rechaza la redacción
  • Nombre del testigo, marcado PERSONA, al 82 % — revisado — el revisor acepta
  • Nombre del perito, marcado PERSONA, al 71 % — revisado — el revisor acepta (datos de terceros)

Cada decisión tiene una base numérica. El registro de auditoría está completo.

Construir registros de cumplimiento

Para el RGPD Artículo 5(1)(f) y la HIPAA Security Rule, las herramientas con puntuación generan registros por sí solas.

Los registros de auditoría por entidad capturan el tipo de entidad, la puntuación, el tipo de decisión (automática o manual), el ID del revisor y la hora. Estos se exportan como CSV para investigaciones de autoridades de protección de datos.

Los registros de umbral documentan la configuración actual y cada cambio. Cada cambio incluye quién lo realizó, cuándo y por qué. Esto demuestra una política gestionada y deliberada.

Los informes de estadísticas cubren tasas de detección por tipo de entidad, tasas de revisión del Nivel 2 y tasas de anulación. Responden a una autoridad de datos que pregunta: "Muéstrenos sus controles."

Para orientación sobre registros de auditoría HIPAA: Redacción explicable: auditorías HIPAA.

Un indicador sí/no es una suposición. Una puntuación es evidencia.

Fuentes

¿Listo para proteger sus datos?

Comience a anonimizar PII con más de 285 tipos de entidades en 48 idiomas.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.