Docs/Glossary

Glosario de Privacidad y Tecnología

Definiciones de todos los términos, siglas y conceptos utilizados en la anonimización de PII y la privacidad de datos.

Volver a la documentación

94 términos

2

2FA

Autenticación de Dos Factores

Cifrado y Seguridad

Autenticación que requiere dos factores de verificación distintos: algo que el usuario sabe (contraseña) y algo que el usuario tiene (aplicación TOTP, llave de hardware) o es (biométrico). Soportado en anonym.legal como una capa adicional sobre ZK Auth.

#twofa

A

AES-256-GCM

Estándar de Cifrado Avanzado de 256 bits en Modo Galois/Counter

Cifrado y Seguridad

Un algoritmo de cifrado autenticado que combina AES-256 (clave de 256 bits) con Galois/Counter Mode para garantizar confidencialidad e integridad. Utilizado en la anonimización reversible de anonym.legal para cifrar las entidades reemplazadas. Proporciona tanto secreto como detección de manipulación.

#aes256gcm

Anonymization

Anonimización de Datos

Privacidad de Datos y PII

El proceso irreversible de eliminar o transformar información identificativa para que las personas ya no puedan ser identificadas, ni directa ni indirectamente. Según el GDPR, los datos verdaderamente anonimizados quedan fuera del alcance de la regulación.

#anonymization

Aplicación de Escritorio

Aplicación de Escritorio de anonym.legal

Plataforma y Productos

Aplicación multiplataforma (Windows, macOS, Linux) desarrollada con Tauri 2.0 y React 18. Ofrece procesamiento local de archivos, bóveda BIP39 para ZK Auth sin conexión, exportación por lotes y sincronización con la API. Compatible con implementaciones aisladas sin acceso a internet.

#desktopapp

Aplicación Web

Aplicación Web de anonym.legal

Plataforma y Productos

Interfaz basada en navegador en anonym.legal para análisis, anonimización y descifrado de PII. Admite entrada de texto, carga de archivos (PDF, DOCX, TXT), procesamiento por lotes, ZK Auth, 48 idiomas y más de 285 tipos de entidades. No requiere instalación.

#webapp

Argon2id

Función de Derivación de Claves Argon2id

Cifrado y Seguridad

Ganador de la Competencia de Hashing de Contraseñas de 2015. Argon2id combina la resistencia a canales laterales de Argon2i y la resistencia a GPU de Argon2d. Utilizado en anonym.legal y en la bóveda de la aplicación de escritorio para derivar claves de cifrado a partir de frases secretas de usuario.

#argon2id

B

BIP39

Bitcoin Improvement Proposal 39 — Frases Mnemotécnicas

Cifrado y Seguridad

Un estándar para generar frases semilla mnemotécnicas legibles por humanos (12–24 palabras) a partir de una semilla criptográfica. Utilizado en la bóveda de la aplicación de escritorio de anonym.legal como respaldo fácil de usar para la clave de cifrado derivada con Argon2id.

#bip39

Bóveda

Bóveda de Claves de Cifrado

Plataforma y Productos

Almacenamiento local seguro para claves de cifrado en la Aplicación de Escritorio, protegido mediante derivación de clave Argon2id a partir de una frase maestra. Las claves se almacenan cifradas usando AES-256-GCM y se respaldan mediante frases mnemotécnicas BIP39.

#vault

C

CCPA

Ley de Privacidad del Consumidor de California

Cumplimiento y Regulaciones

Ley de privacidad de California que otorga a los residentes el derecho a conocer, eliminar y optar por no vender su información personal. Aplica a empresas que cumplen ciertos umbrales de ingresos, volumen de datos o venta de datos. Modificada significativamente por la CPRA (aprobada en noviembre de 2020, vigente desde enero de 2023).

#ccpa

CLOUD Act

Ley de Uso Legal Clarificado de Datos en el Extranjero

Cumplimiento y Regulaciones

Ley federal de EE. UU. (2018) que permite a las autoridades estadounidenses exigir a proveedores cloud con sede en EE. UU. la entrega de datos almacenados en el extranjero. Entra en conflicto con las normas de transferencia de datos del GDPR para residentes de la UE. Anonimizar los datos antes de subirlos a la nube es una mitigación común.

#cloudact

Code-Switching

Code-Switching Multilingüe

Tecnología de Detección

El fenómeno de mezclar dos o más idiomas dentro de un solo texto o conversación. Común en documentos multilingües (por ejemplo, documentos legales alemanes con términos técnicos en inglés). La detección híbrida de anonym.legal maneja texto con code-switching aplicando múltiples modelos de idioma simultáneamente.

#codeswitching

Complemento de Office

Complemento de Microsoft Office de anonym.legal

Plataforma y Productos

Extensión de Microsoft Office que integra la anonimización de PII directamente en Word, Excel y PowerPoint. Permite redactar dentro del documento, gestión de preajustes, ZK Auth y sincronización entre dispositivos. Disponible en Microsoft AppSource.

#officeaddin

Confidence Scoring

Puntuación de Confianza en la Detección de Entidades

Tecnología de Detección

Una puntuación de 0 a 1 que indica cuán seguro está el modelo de detección de que un fragmento de texto es una entidad PII. anonym.legal expone umbrales de confianza configurables para que los usuarios puedan ajustar la precisión frente a la exhaustividad según su caso de uso específico.

#confidencescoring

CSP

Política de Seguridad de Contenidos

Cifrado y Seguridad

Un mecanismo de cabecera de respuesta HTTP y metaetiqueta que restringe qué recursos (scripts, estilos, imágenes) puede cargar un navegador. La CSP de anonym.legal incluye object-src 'none', script-src con nonces y upgrade-insecure-requests para prevenir ataques XSS.

#csp

D

Data Minimization

Principio de Minimización de Datos del GDPR

Privacidad de Datos y PII

Principio del GDPR Artículo 5(1)(c) que exige que solo se recojan y procesen datos adecuados, pertinentes y limitados a lo necesario para el propósito especificado. Es una restricción fundamental en el diseño de sistemas conformes con la privacidad.

#dataminimization

Data Residency

Requisitos de Residencia de Datos

Cumplimiento y Regulaciones

Requisitos legales o contractuales que especifican en qué ubicación geográfica deben almacenarse y procesarse los datos. Relevante para el GDPR (transferencias de datos fuera del EEE), la BDSG alemana y regulaciones sectoriales en sanidad y finanzas.

#dataresidency

Data Sovereignty

Soberanía Digital de los Datos

Cumplimiento y Regulaciones

El principio de que los datos están sujetos a las leyes y estructuras de gobernanza del país en el que se recopilan. Más amplio que la residencia de datos, abarca el control sobre quién puede acceder a los datos y bajo qué marco legal.

#datasovereignty

De-anonymization

Ataque de Reidentificación

Privacidad de Datos y PII

El proceso de reidentificar a personas a partir de conjuntos de datos supuestamente anonimizados, mediante el cruce con información auxiliar. Es un riesgo clave al compartir datos con un nivel insuficiente de anonimización.

#deanonymization

Defendibilidad

Anonimización Legalmente Defendible

Legal y Auditoría

La capacidad de demostrar ante reguladores, tribunales o auditores que la anonimización se realizó utilizando una metodología documentada, consistente y técnicamente sólida. Los registros de auditoría, puntuaciones de confianza y configuraciones de operador de anonym.legal respaldan flujos de trabajo de anonimización defendibles.

#defensibility

Destrucción de Pruebas

Destrucción o Alteración de Evidencia

Legal y Auditoría

La destrucción, alteración o falta de preservación de evidencia relevante para un litigio. Una redacción excesiva que haga los documentos ilegibles puede constituir destrucción de pruebas. Calibrar la precisión de la anonimización (umbrales de confianza, selección de entidades) es importante para una redacción legalmente defendible.

#spoliation

Differential Privacy

Privacidad Diferencial (DP)

Privacidad de Datos y PII

Marco matemático para publicar información estadística sobre conjuntos de datos proporcionando garantías demostrables de que los datos de ningún individuo pueden ser distinguidos. Se utiliza en análisis agregados para evitar la reidentificación incluso al consultar resultados agregados.

#differentialprivacy

DLP

Prevención de Pérdida de Datos

Plataforma y Productos

Disciplina de seguridad y categoría de herramientas de software que detectan y previenen la transmisión no autorizada de datos sensibles fuera de una organización. anonym.legal funciona como una solución DLP a nivel de navegador y de IA para PII.

#dlp

DPA

Acuerdo de Procesamiento de Datos

Cumplimiento y Regulaciones

Contrato legalmente vinculante entre un responsable y un encargado del tratamiento de datos, requerido por el Artículo 28 del GDPR. Especifica el objeto, duración, naturaleza, finalidad y tipo de tratamiento de datos personales, así como los derechos y obligaciones de ambas partes.

#dpa

DPIA

Evaluación de Impacto en la Protección de Datos

Cumplimiento y Regulaciones

Proceso de evaluación de riesgos requerido por el Artículo 35 del GDPR para actividades de tratamiento que probablemente impliquen altos riesgos para los derechos y libertades de las personas. Obligatorio para la elaboración de perfiles sistemática, el tratamiento a gran escala de PHI y la vigilancia en espacios públicos.

#dpia

E

e-Discovery

Descubrimiento Electrónico

Legal y Auditoría

El proceso de identificar, recopilar y producir información almacenada electrónicamente en procedimientos legales. Requiere la redacción de PII e información privilegiada en los documentos producidos. Es un caso de uso principal para los departamentos legales que utilizan anonym.legal.

#ediscovery

E2EE

Cifrado de Extremo a Extremo

Cifrado y Seguridad

Cifrado en el que solo las partes comunicantes pueden leer los mensajes; el proveedor de servicios no tiene acceso al texto claro. En el modo ZK Auth de anonym.legal, las claves de cifrado nunca salen del dispositivo del cliente, logrando E2EE para el almacenamiento de salidas anonimizadas.

#e2ee

Entidades de Salud

Tipos de Entidad PII de Salud

Tipos de Entidad

Tipos de entidades para los 18 identificadores Safe Harbor de HIPAA y PII adicionales relacionados con la salud: US_MRN (números de historia clínica), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY y entidades de contexto de diagnóstico/tratamiento.

#healthcareentities

Entidades Financieras

Tipos de Entidad PII Financieros

Tipos de Entidad

Tipos de entidades que cubren identificadores financieros: CREDIT_CARD (suma de comprobación Luhn), IBAN_CODE (suma de comprobación ISO 13616), SWIFT_CODE (formato BIC), US_BANK_NUMBER, NRP (identificación fiscal española). Detectados con validación de suma de comprobación para minimizar falsos positivos.

#financialentities

Entidades Personalizadas

Reconocedores de Entidades Personalizadas

Plataforma y Productos

Patrones de PII definidos por el usuario que se agregan a los más de 285 tipos de entidades integrados de anonym.legal. Admite patrones regex, listas de palabras y listas de denegación. Útil para identificadores específicos de la organización como IDs de empleados, códigos internos de proyectos o nombres de productos propietarios.

#customentities

Entidades Universales

Tipos de Entidad Universales por Idioma

Tipos de Entidad

Tipos de entidades detectadas independientemente del idioma del texto, normalmente mediante expresiones regulares basadas en formato con validación de suma de comprobación. Ejemplos: CREDIT_CARD, IBAN_CODE, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS, URL, dirección CRYPTO.

#universalentities

Extensión de Chrome

Extensión de Chrome de anonym.legal

Plataforma y Productos

Extensión de navegador (Manifest V3) que intercepta texto antes de enviarlo a chatbots de IA (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonimiza en tiempo real y opcionalmente descifra respuestas de IA usando claves de cifrado guardadas.

#chromeextension

F

FOIA

Ley de Libertad de Información

Cumplimiento y Regulaciones

Ley federal de EE. UU. (y estatutos equivalentes en otras jurisdicciones) que otorga acceso público a registros gubernamentales. Exige la redacción de PII y otra información exenta antes de la divulgación — un caso de uso principal para flujos de trabajo de anonimización en el ámbito legal y gubernamental.

#foia

G

GDPR

Reglamento General de Protección de Datos

Cumplimiento y Regulaciones

Reglamento de la UE 2016/679, el principal marco de protección de datos de la Unión Europea. Aplica a cualquier organización que procese datos personales de residentes de la UE. Sanciones de hasta 20 millones de euros o el 4% de la facturación anual global. Derechos clave: acceso, supresión, portabilidad, restricción, oposición.

#gdpr

GDPR Article 25

GDPR Artículo 25 — Protección de Datos desde el Diseño y por Defecto

Cumplimiento y Regulaciones

Exige que los responsables implementen medidas técnicas y organizativas apropiadas (como la seudonimización y la minimización de datos) tanto en el momento del diseño del sistema como por defecto durante el tratamiento.

#gdprarticle25

GDPR Article 32

GDPR Artículo 32 — Seguridad del Tratamiento

Cumplimiento y Regulaciones

Exige que responsables y encargados implementen medidas técnicas y organizativas apropiadas para garantizar un nivel de seguridad adecuado al riesgo, incluyendo cifrado, seudonimización, confidencialidad, integridad, disponibilidad y resiliencia de los sistemas de tratamiento.

#gdprarticle32

GenAI DLP

Prevención de Pérdida de Datos en IA Generativa

Plataforma y Productos

Categoría DLP especializada en evitar que PII y datos confidenciales se incluyan en indicaciones enviadas a modelos de IA generativa (ChatGPT, Claude, Gemini). La Extensión de Chrome y el Servidor MCP de anonym.legal abordan este riesgo en el punto de entrada.

#genaidlp

H

Hashing

Hashing Criptográfico

Privacidad de Datos y PII

Transformación unidireccional de datos en un resumen de longitud fija utilizando algoritmos como SHA-256. Se utiliza para seudonimización consistente, deduplicación y verificación de integridad. Los valores hash no pueden revertirse, pero pueden ser vulnerables a ataques de tablas arcoíris si no se utiliza sal.

#hashing

Hetzner

Hetzner Online GmbH

Infraestructura

Proveedor alemán de servicios cloud y hosting donde se ejecuta la infraestructura de producción de anonym.legal. Ubicado en Falkenstein, Sajonia (centro de datos fsn1) con certificación ISO 27001. Elegido por la residencia de datos en la UE, postura de cumplimiento y jurisdicción favorable al GDPR bajo la ley alemana.

#hetzner

HIPAA

Ley de Portabilidad y Responsabilidad de Seguros de Salud

Cumplimiento y Regulaciones

Ley federal de EE. UU. que establece estándares para la protección de información médica sensible de los pacientes. La Regla de Privacidad regula el uso de PHI; la Regla de Seguridad exige salvaguardas administrativas, físicas y técnicas para PHI electrónica (ePHI). Las infracciones pueden conllevar multas de hasta 1,9 millones de dólares por categoría y año.

#hipaa

HIPAA Safe Harbor

Método de Desidentificación Safe Harbor de HIPAA

Cumplimiento y Regulaciones

Uno de los dos métodos de desidentificación aprobados por HIPAA que exige la eliminación de los 18 identificadores especificados del paciente (nombre, dirección, fechas, números de teléfono, SSN, correo electrónico, dirección IP, biometría, etc.) para que los datos de salud no sean identificables individualmente.

#hipaasafeharbor

HSTS

HTTP Strict Transport Security

Cifrado y Seguridad

Un mecanismo de política de seguridad web que obliga a los navegadores a usar solo conexiones HTTPS. anonym.legal establece Strict-Transport-Security: max-age=31536000; includeSubDomains para prevenir ataques de degradación de protocolo y secuestro de cookies.

#hsts

Hybrid Detection

Detección Híbrida NLP + Regex + ML

Tecnología de Detección

El enfoque de tres capas de anonym.legal: patrones regex para PII estructurada (números de teléfono, IBANs, tarjetas de crédito), modelos NLP/NER para entidades contextuales (nombres, organizaciones, ubicaciones) y clasificadores ML para casos ambiguos. Reduce tanto los falsos positivos como los falsos negativos.

#hybriddetection

I

Identificación Gubernamental

Tipos de Entidad de Identificadores Gubernamentales

Tipos de Entidad

Tipos de entidades para identificadores nacionales y emitidos por gobiernos: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE y más de 50 formatos de identificación específicos de países. Detectados mediante patrones regex y suma de comprobación específicos de cada país.

#governmentid

Identificadores de Seguro

Tipos de Entidad de Seguro

Tipos de Entidad

Tipos de entidades para identificadores relacionados con seguros: US_NPI (Identificador Nacional de Proveedor para proveedores de salud), HEALTHCARE_PLAN_BENEFICIARY y números de seguro de salud específicos de cada país (por ejemplo, DE_HEALTH_INSURANCE_NUMBER).

#insuranceidentifiers

Identificadores de Vehículos

Tipos de Entidad de Vehículos

Tipos de Entidad

Tipos de entidades para identificadores relacionados con vehículos: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (Número de Identificación del Vehículo) y formatos de matrícula específicos de cada país.

#vehicleidentifiers

Identificadores Digitales

Tipos de Entidad de Identidad Digital

Tipos de Entidad

Tipos de entidades para identificadores digitales y en línea: EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS (IPv4 e IPv6), URL, DOMAIN_NAME, CRYPTO (direcciones Bitcoin/Ethereum) e identificadores específicos de plataformas.

#digitalidentifiers

ISO 27001

Gestión de Seguridad de la Información ISO/IEC 27001

Cumplimiento y Regulaciones

Norma internacional para sistemas de gestión de seguridad de la información (ISMS). La certificación requiere políticas documentadas, evaluaciones de riesgos y controles. Los servidores de la UE de anonym.legal cuentan con certificación ISO 27001, garantizando una gobernanza de seguridad estructurada.

#iso27001

ISO 27001 SoA

Declaración de Aplicabilidad

Cumplimiento y Regulaciones

Documento obligatorio de ISO 27001 que enumera todos los controles del Anexo A, indicando cuáles son aplicables a la organización y proporcionando justificación para inclusiones y exclusiones. Requerido para la certificación y auditorías.

#iso27001soa

J

JWT

JSON Web Token

Cifrado y Seguridad

Un formato de token compacto y seguro para URL, utilizado para transmitir afirmaciones entre partes. anonym.legal utiliza JWTs firmados con HS256 para autenticación interna entre servicios (por ejemplo, frontend → Presidio API). Los tokens son de corta duración y se validan en el servidor.

#jwt

K

KEK

Clave de Cifrado de Claves

Cifrado y Seguridad

Una clave utilizada para cifrar otras claves en lugar de datos directamente. En la arquitectura ZK de anonym.legal, la clave derivada de la frase secreta del usuario actúa como KEK para proteger las claves de cifrado por documento almacenadas en la bóveda cifrada.

#kek

L

Language Detection

Detección Automática de Idioma

Tecnología de Detección

La identificación automática del idioma del texto de entrada antes del análisis de PII. anonym.legal detecta el idioma a nivel de solicitud y enruta a la pipeline de modelo NER apropiada, con inglés como respaldo para idiomas no soportados.

#languagedetection

Limitación de Tasa

Limitación de Tasa de la API

Infraestructura

Controles sobre el número de solicitudes API que un cliente puede realizar en una ventana de tiempo. Previene abusos y garantiza una asignación justa de recursos. anonym.legal aplica límites de tasa por usuario según el nivel del plan, recomendando retroceso exponencial para la lógica de reintentos.

#ratelimiting

M

Masking

Enmascaramiento de Datos

Privacidad de Datos y PII

Sustitución de valores sensibles por datos ficticios pero realistas que conservan el formato y la estructura. Se utiliza en entornos de pruebas, análisis y para compartir conjuntos de datos sin exponer PII real.

#masking

MCP

Model Context Protocol

Plataforma y Productos

Un protocolo abierto desarrollado por Anthropic que permite a los modelos de IA interactuar con herramientas externas y fuentes de datos de manera estandarizada. anonym.legal implementa un Servidor MCP para que las herramientas de codificación de IA puedan invocar la anonimización sin salir de su flujo de trabajo.

#mcp

ML Models

Modelos de Aprendizaje Automático para Detección de PII

Tecnología de Detección

Modelos estadísticos entrenados en corpus de texto etiquetados para reconocer PII en contexto. anonym.legal utiliza tanto pipelines de transformadores de spaCy como XLM-RoBERTa ajustado para reconocimiento de entidades multilingüe a escala de producción.

#mlmodels

N

NER

Reconocimiento de Entidades Nombradas

Tecnología de Detección

Una tarea de procesamiento de lenguaje natural que identifica y clasifica entidades nombradas en un texto en categorías predefinidas como personas, organizaciones, ubicaciones, fechas e identificadores médicos. La técnica principal de ML que impulsa la detección de PII en anonym.legal.

#ner

NIS2

Directiva de Seguridad de Redes y Sistemas de Información 2

Cumplimiento y Regulaciones

Directiva de la UE 2022/2555 que amplía la Directiva NIS original para cubrir más sectores (sanidad, energía, transporte, infraestructura digital) y refuerza los requisitos de ciberseguridad. El plazo de transposición fue el 17 de octubre de 2024; la mayoría de los estados miembros de la UE no lo cumplieron y la Comisión Europea inició procedimientos de infracción contra los estados no conformes.

#nis2

NLP

Procesamiento de Lenguaje Natural

Tecnología de Detección

Una rama de la inteligencia artificial que se ocupa de la interacción entre computadoras y el lenguaje humano. En la detección de PII, los modelos de NLP comprenden el contexto, la gramática y la semántica para identificar entidades que los patrones de regex por sí solos no detectarían.

#nlp

O

Operadores

Operadores de Anonimización

Plataforma y Productos

La estrategia de reemplazo aplicada a la PII detectada. anonym.legal admite REPLACE (texto de marcador de posición), REDACT (cadena vacía), MASK (asteriscos), HASH (resumen SHA-256), ENCRYPT (AES-256-GCM reversible) y CUSTOM (reemplazo definido por el usuario).

#operators

P

PCI DSS

Estándar de Seguridad de Datos para la Industria de Tarjetas de Pago

Cumplimiento y Regulaciones

Estándar de seguridad para organizaciones que manejan datos de tarjetas de pago, mantenido por el PCI Security Standards Council. Requiere cifrado, controles de acceso, registros y pruebas periódicas. El incumplimiento puede resultar en multas y pérdida de privilegios de procesamiento de tarjetas.

#pcidss

PHI

Información de Salud Protegida

Privacidad de Datos y PII

Cualquier información relacionada con la salud vinculada a una persona identificable, regulada por HIPAA en EE. UU. Incluye diagnósticos, registros de tratamientos, datos de seguros y cualquiera de los 18 identificadores Safe Harbor de HIPAA.

#phi

PII

Información de Identificación Personal

Privacidad de Datos y PII

Cualquier dato que pueda identificar a una persona específica, ya sea directamente o en combinación con otros datos. Ejemplos: nombres, direcciones de correo electrónico, números de seguridad social, direcciones IP, registros biométricos.

#pii

Preajustes

Preajustes de Anonimización

Plataforma y Productos

Configuraciones guardadas de tipos de entidades seleccionadas, umbrales de confianza y opciones de salida que pueden aplicarse con un solo clic. Los preajustes se sincronizan entre la Aplicación Web, el Complemento de Office y la Aplicación de Escritorio mediante almacenamiento en la nube cifrado.

#presets

Presidio

Microsoft Presidio

Tecnología de Detección

Un SDK de protección y anonimización de datos de código abierto de Microsoft. El motor de detección de anonym.legal está construido sobre los servicios de análisis y anonimización de Presidio, ampliado con más de 285 reconocedores de entidades personalizados en 48 idiomas.

#presidio

Presidio Analyzer

Microsoft Presidio Analyzer Service

Infraestructura

El componente de detección del backend de anonym.legal (puerto 8011). Recibe texto y devuelve una lista de entidades PII detectadas con sus posiciones, tipos y puntuaciones de confianza. Ampliado con más de 285 reconocedores personalizados en 48 idiomas.

#presidioanalyzer

Presidio Anonymizer

Microsoft Presidio Anonymizer Service

Infraestructura

El componente de transformación del backend de anonym.legal (puerto 8012). Toma texto y resultados del analizador como entrada, aplica el operador seleccionado (REPLACE, REDACT, MASK, HASH, ENCRYPT) a cada entidad detectada y devuelve el texto anonimizado.

#presidioanonymizer

Privacy by Design

Privacidad desde el Diseño y por Defecto

Privacidad de Datos y PII

El principio, exigido por el GDPR Artículo 25, de que las medidas de protección de datos se integran en los sistemas desde el inicio y no como una adición posterior. Incluye minimización de datos, controles de acceso, cifrado y seudonimización a nivel de arquitectura.

#privacybydesign

Privilegio Abogado-Cliente

Protección del Privilegio Abogado-Cliente

Legal y Auditoría

Protección legal para las comunicaciones confidenciales entre abogados y clientes. En la revisión de documentos y e-discovery, el contenido privilegiado debe ser identificado y retenido o redactado. Los tipos de entidad personalizados en anonym.legal pueden configurarse para marcar indicadores de contenido privilegiado.

#attorneyclientprivilege

Procesamiento por Lotes

Anonimización de Archivos por Lotes

Plataforma y Productos

Procesamiento simultáneo de múltiples archivos en una sola operación. El modo por lotes de anonym.legal admite archivos PDF, DOCX y TXT con configuración de entidades por archivo, umbrales de confianza y selección de formato de salida.

#batchprocessing

Protección DDoS

Protección contra Denegación de Servicio Distribuida

Infraestructura

Defensas a nivel de infraestructura contra ataques de denegación de servicio distribuida. La infraestructura de servidores de anonym.legal incluye reglas de firewall (UFW), límites de conexión en nginx y protecciones equivalentes a Cloudflare aguas arriba para mantener la disponibilidad.

#ddosprotection

Pseudonymization

Seudonimización de Datos

Privacidad de Datos y PII

Sustitución de identificadores directos por valores artificiales (seudónimos), manteniendo la posibilidad de reidentificar a las personas mediante una clave separada. El GDPR Artículo 4(5) la reconoce como una técnica que mejora la privacidad, pero no exime a los datos seudonimizados de la regulación.

#pseudonymization

R

Redacción Excesiva

Redacción Excesiva (Falsos Positivos)

Legal y Auditoría

Eliminar más información de la necesaria, reduciendo la utilidad del documento y pudiendo constituir destrucción de pruebas en procedimientos legales. Causado por umbrales de confianza bajos o selección de entidades demasiado amplia. Ajustable mediante los controles de umbral y entidades de anonym.legal.

#overredaction

Redacción Insuficiente

Redacción Insuficiente (Falsos Negativos)

Legal y Auditoría

No eliminar toda la PII, dejando a las personas expuestas en documentos compartidos. Es el riesgo de cumplimiento más común. Causado por umbrales de confianza altos, tipos de entidad ausentes o formatos de PII novedosos. Se mitiga mediante la detección híbrida y el soporte de entidades personalizadas de anonym.legal.

#underredaction

Redaction

Redacción de Datos

Privacidad de Datos y PII

Eliminación u ocultación permanente de información sensible en documentos, reemplazándola por un marcador visual como [REDACTED] o una barra negra. A diferencia del cifrado, la redacción es un proceso irreversible y los datos originales no pueden recuperarse.

#redaction

Redactor de Imágenes

Presidio Image Redactor Service

Infraestructura

Un servicio backend especializado (puerto 8013) que detecta y redacta PII de archivos de imagen (PNG, JPEG) usando OCR y análisis Presidio. Aplica una barra negra sobre las regiones de PII detectadas en la imagen original.

#presidioimageredactor

Regex

Coincidencia de Patrones con Expresiones Regulares

Tecnología de Detección

Coincidencia de texto basada en patrones utilizando sintaxis de lenguaje formal. En la detección de PII, regex gestiona identificadores estructuralmente predecibles (números de teléfono, tarjetas de crédito, IBANs, direcciones de correo electrónico) con validación de suma de comprobación. Complementa NER para una detección híbrida.

#regex

Registro de Auditoría

Registro de Auditoría Inmutable

Legal y Auditoría

Un registro secuencial e inalterable que documenta quién accedió, modificó o procesó los datos y cuándo. Requerido por ISO 27001 (A.8.15), HIPAA Security Rule (§164.312(b)) y normas de e-discovery. anonym.legal registra todas las operaciones de anonimización con marcas de tiempo, recuentos de entidades e identificadores de operador.

#audittrail

Regla 26

Federal Rules of Civil Procedure Rule 26

Legal y Auditoría

Regla del procedimiento civil de EE. UU. que regula las obligaciones de descubrimiento. Rule 26(g) exige que los abogados certifiquen que las solicitudes y divulgaciones de descubrimiento no se realizan con fines indebidos, incluyendo la omisión de redactar correctamente la PII en los documentos producidos.

#rule26

Residencia de Datos en la UE

Residencia de Datos en la Unión Europea

Infraestructura

La garantía de que los datos se almacenan y procesan exclusivamente dentro del territorio de la UE/EEE. Los servidores de producción de anonym.legal están en Alemania (Hetzner Frankfurt), asegurando que todo el procesamiento se realiza bajo jurisdicción GDPR sin implicaciones de transferencia transfronteriza de datos.

#eudataresidency

REST API

API RESTful

Infraestructura

anonym.legal expone una API HTTP RESTful para integración programática. Los endpoints incluyen /api/analyze, /api/anonymize, /api/image y /api/structured. Autenticada mediante tokens JWT bearer. Documentación OpenAPI completa disponible en la Referencia de API.

#restapi

S

SCCs

Cláusulas Contractuales Tipo

Cumplimiento y Regulaciones

Cláusulas contractuales preaprobadas y conformes con el GDPR para transferir datos personales desde la UE/EEE a terceros países. Actualizadas por la Comisión Europea en 2021 (2021/914/UE) para abordar los requisitos de Schrems II, incluyendo una Evaluación de Impacto de Transferencia.

#sccs

Schrems II

Sentencia Schrems II (C-311/18)

Cumplimiento y Regulaciones

Sentencia de 2020 del Tribunal de Justicia de la UE que invalida el marco Privacy Shield UE-EE. UU. para transferencias transatlánticas de datos, citando protecciones insuficientes en la legislación de vigilancia de EE. UU. Requiere medidas suplementarias (cifrado, anonimización) al utilizar Cláusulas Contractuales Tipo.

#schremsii

Servidor MCP

Servidor Model Context Protocol

Plataforma y Productos

La integración del Servidor MCP de anonym.legal permite que asistentes de codificación de IA (Claude Desktop, Cursor, VS Code Copilot) llamen directamente a la API de anonimización como herramienta. La PII se elimina del código, indicaciones y contexto antes de enviarse al modelo de IA.

#mcpserver

SHA-256

Algoritmo de Hash Seguro de 256 bits

Cifrado y Seguridad

Una función hash criptográfica que produce un resumen de 256 bits. Utilizada en anonym.legal para autenticación HMAC de solicitudes API, pruebas de ZK auth y seudonimización consistente de entidades (el hash con sal produce el mismo reemplazo para el mismo valor original).

#sha256

Sistema de Tokens

Sistema de Créditos por Tokens de anonym.legal

Plataforma y Productos

Facturación basada en uso donde las llamadas a la API consumen tokens calculados según la longitud del texto, el número de entidades y el modo de procesamiento (analizar vs. anonimizar). Los costos de tokens son configurables en la base de datos y se muestran en tiempo real antes del procesamiento.

#tokensystem

spaCy

Librería NLP spaCy

Tecnología de Detección

Librería de NLP de código abierto y nivel industrial en Python. anonym.legal utiliza los modelos basados en transformadores de spaCy para 24 idiomas (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko, y más) para el reconocimiento de entidades nombradas en la pipeline de Presidio.

#spacy

Stanza

Librería NLP Stanza (Stanford NLP)

Tecnología de Detección

Kit de herramientas NLP en Python del Stanford NLP Group que soporta más de 70 idiomas con modelos neuronales de última generación. Se utiliza como backend NER complementario en anonym.legal para idiomas no cubiertos por los modelos de spaCy.

#stanza

T

Tipo de Entidad

Tipo de Entidad PII

Tipos de Entidad

Una categoría de información personal que el motor de detección reconoce y puede anonimizar. Ejemplos: PERSON, EMAIL_ADDRESS, PHONE_NUMBER, CREDIT_CARD, IBAN_CODE, US_SSN, IP_ADDRESS. anonym.legal admite más de 285 tipos de entidades en 48 idiomas.

#entitytype

TLS

Transport Layer Security

Cifrado y Seguridad

El protocolo criptográfico que protege los datos en tránsito. anonym.legal aplica TLS 1.2 como mínimo con preferencia por TLS 1.3, HSTS con max-age de un año y HTTP/2. Todo el tráfico entre clientes y el servidor está cifrado en tránsito.

#tls

Tokenization

Tokenización de Datos

Privacidad de Datos y PII

Sustitución de datos sensibles por un marcador no sensible (token) que se asocia al original en un almacén seguro. A diferencia del cifrado, el token en sí no tiene relación matemática con los datos originales.

#tokenization

X

XChaCha20

XChaCha20-Poly1305

Cifrado y Seguridad

Un algoritmo de cifrado autenticado que ofrece alto rendimiento en sistemas sin aceleración de hardware AES. Utiliza un nonce de 192 bits (extendido del nonce de 96 bits del estándar IETF ChaCha20 según RFC 8439), eliminando riesgos de colisión de nonce. Se utiliza como cifrado alternativo en la capa de cifrado de anonym.legal.

#xchacha20

XLM-RoBERTa

RoBERTa Multilingüe

Tecnología de Detección

Un modelo de lenguaje transformador multilingüe entrenado en 100 idiomas, desarrollado por Meta AI. Utilizado en anonym.legal para tareas de NER multilingüe, especialmente para tipos de entidades e idiomas donde no hay modelos monolingües disponibles.

#xlmroberta

Z

Zero-Knowledge

Arquitectura Zero-Knowledge

Cifrado y Seguridad

Un diseño de sistema en el que el proveedor de servicios no tiene acceso alguno a los datos en texto claro de los usuarios ni a sus claves de cifrado. Todo el cifrado/descifrado ocurre del lado del cliente; el servidor nunca ve el contenido original. Previene amenazas internas y divulgaciones forzadas.

#zeroknowledge

ZK Auth

Autenticación Zero-Knowledge

Cifrado y Seguridad

El sistema de autenticación de anonym.legal donde las claves de cifrado se derivan en el lado del cliente a partir de la frase secreta del usuario usando Argon2id, sin ser nunca transmitidas ni almacenadas en el servidor. El servidor almacena solo una prueba criptográfica, no la clave ni la frase secreta.

#zkauth