Glosario de Privacidad y Tecnología
Definiciones de todos los términos, siglas y conceptos utilizados en la anonimización de PII y la privacidad de datos.
Volver a la documentación94 términos
2
2FA
Autenticación de Dos Factores
Autenticación que requiere dos factores de verificación distintos: algo que el usuario sabe (contraseña) y algo que el usuario tiene (aplicación TOTP, llave de hardware) o es (biométrico). Soportado en anonym.legal como una capa adicional sobre ZK Auth.
#twofaA
AES-256-GCM
Estándar de Cifrado Avanzado de 256 bits en Modo Galois/Counter
Un algoritmo de cifrado autenticado que combina AES-256 (clave de 256 bits) con Galois/Counter Mode para garantizar confidencialidad e integridad. Utilizado en la anonimización reversible de anonym.legal para cifrar las entidades reemplazadas. Proporciona tanto secreto como detección de manipulación.
#aes256gcmAnonymization
Anonimización de Datos
El proceso irreversible de eliminar o transformar información identificativa para que las personas ya no puedan ser identificadas, ni directa ni indirectamente. Según el GDPR, los datos verdaderamente anonimizados quedan fuera del alcance de la regulación.
#anonymizationAplicación de Escritorio
Aplicación de Escritorio de anonym.legal
Aplicación multiplataforma (Windows, macOS, Linux) desarrollada con Tauri 2.0 y React 18. Ofrece procesamiento local de archivos, bóveda BIP39 para ZK Auth sin conexión, exportación por lotes y sincronización con la API. Compatible con implementaciones aisladas sin acceso a internet.
#desktopappAplicación Web
Aplicación Web de anonym.legal
Interfaz basada en navegador en anonym.legal para análisis, anonimización y descifrado de PII. Admite entrada de texto, carga de archivos (PDF, DOCX, TXT), procesamiento por lotes, ZK Auth, 48 idiomas y más de 285 tipos de entidades. No requiere instalación.
#webappArgon2id
Función de Derivación de Claves Argon2id
Ganador de la Competencia de Hashing de Contraseñas de 2015. Argon2id combina la resistencia a canales laterales de Argon2i y la resistencia a GPU de Argon2d. Utilizado en anonym.legal y en la bóveda de la aplicación de escritorio para derivar claves de cifrado a partir de frases secretas de usuario.
#argon2idB
BIP39
Bitcoin Improvement Proposal 39 — Frases Mnemotécnicas
Un estándar para generar frases semilla mnemotécnicas legibles por humanos (12–24 palabras) a partir de una semilla criptográfica. Utilizado en la bóveda de la aplicación de escritorio de anonym.legal como respaldo fácil de usar para la clave de cifrado derivada con Argon2id.
#bip39Bóveda
Bóveda de Claves de Cifrado
Almacenamiento local seguro para claves de cifrado en la Aplicación de Escritorio, protegido mediante derivación de clave Argon2id a partir de una frase maestra. Las claves se almacenan cifradas usando AES-256-GCM y se respaldan mediante frases mnemotécnicas BIP39.
#vaultC
CCPA
Ley de Privacidad del Consumidor de California
Ley de privacidad de California que otorga a los residentes el derecho a conocer, eliminar y optar por no vender su información personal. Aplica a empresas que cumplen ciertos umbrales de ingresos, volumen de datos o venta de datos. Modificada significativamente por la CPRA (aprobada en noviembre de 2020, vigente desde enero de 2023).
#ccpaCLOUD Act
Ley de Uso Legal Clarificado de Datos en el Extranjero
Ley federal de EE. UU. (2018) que permite a las autoridades estadounidenses exigir a proveedores cloud con sede en EE. UU. la entrega de datos almacenados en el extranjero. Entra en conflicto con las normas de transferencia de datos del GDPR para residentes de la UE. Anonimizar los datos antes de subirlos a la nube es una mitigación común.
#cloudactCode-Switching
Code-Switching Multilingüe
El fenómeno de mezclar dos o más idiomas dentro de un solo texto o conversación. Común en documentos multilingües (por ejemplo, documentos legales alemanes con términos técnicos en inglés). La detección híbrida de anonym.legal maneja texto con code-switching aplicando múltiples modelos de idioma simultáneamente.
#codeswitchingComplemento de Office
Complemento de Microsoft Office de anonym.legal
Extensión de Microsoft Office que integra la anonimización de PII directamente en Word, Excel y PowerPoint. Permite redactar dentro del documento, gestión de preajustes, ZK Auth y sincronización entre dispositivos. Disponible en Microsoft AppSource.
#officeaddinConfidence Scoring
Puntuación de Confianza en la Detección de Entidades
Una puntuación de 0 a 1 que indica cuán seguro está el modelo de detección de que un fragmento de texto es una entidad PII. anonym.legal expone umbrales de confianza configurables para que los usuarios puedan ajustar la precisión frente a la exhaustividad según su caso de uso específico.
#confidencescoringCSP
Política de Seguridad de Contenidos
Un mecanismo de cabecera de respuesta HTTP y metaetiqueta que restringe qué recursos (scripts, estilos, imágenes) puede cargar un navegador. La CSP de anonym.legal incluye object-src 'none', script-src con nonces y upgrade-insecure-requests para prevenir ataques XSS.
#cspD
Data Minimization
Principio de Minimización de Datos del GDPR
Principio del GDPR Artículo 5(1)(c) que exige que solo se recojan y procesen datos adecuados, pertinentes y limitados a lo necesario para el propósito especificado. Es una restricción fundamental en el diseño de sistemas conformes con la privacidad.
#dataminimizationData Residency
Requisitos de Residencia de Datos
Requisitos legales o contractuales que especifican en qué ubicación geográfica deben almacenarse y procesarse los datos. Relevante para el GDPR (transferencias de datos fuera del EEE), la BDSG alemana y regulaciones sectoriales en sanidad y finanzas.
#dataresidencyData Sovereignty
Soberanía Digital de los Datos
El principio de que los datos están sujetos a las leyes y estructuras de gobernanza del país en el que se recopilan. Más amplio que la residencia de datos, abarca el control sobre quién puede acceder a los datos y bajo qué marco legal.
#datasovereigntyDe-anonymization
Ataque de Reidentificación
El proceso de reidentificar a personas a partir de conjuntos de datos supuestamente anonimizados, mediante el cruce con información auxiliar. Es un riesgo clave al compartir datos con un nivel insuficiente de anonimización.
#deanonymizationDefendibilidad
Anonimización Legalmente Defendible
La capacidad de demostrar ante reguladores, tribunales o auditores que la anonimización se realizó utilizando una metodología documentada, consistente y técnicamente sólida. Los registros de auditoría, puntuaciones de confianza y configuraciones de operador de anonym.legal respaldan flujos de trabajo de anonimización defendibles.
#defensibilityDestrucción de Pruebas
Destrucción o Alteración de Evidencia
La destrucción, alteración o falta de preservación de evidencia relevante para un litigio. Una redacción excesiva que haga los documentos ilegibles puede constituir destrucción de pruebas. Calibrar la precisión de la anonimización (umbrales de confianza, selección de entidades) es importante para una redacción legalmente defendible.
#spoliationDifferential Privacy
Privacidad Diferencial (DP)
Marco matemático para publicar información estadística sobre conjuntos de datos proporcionando garantías demostrables de que los datos de ningún individuo pueden ser distinguidos. Se utiliza en análisis agregados para evitar la reidentificación incluso al consultar resultados agregados.
#differentialprivacyDLP
Prevención de Pérdida de Datos
Disciplina de seguridad y categoría de herramientas de software que detectan y previenen la transmisión no autorizada de datos sensibles fuera de una organización. anonym.legal funciona como una solución DLP a nivel de navegador y de IA para PII.
#dlpDPA
Acuerdo de Procesamiento de Datos
Contrato legalmente vinculante entre un responsable y un encargado del tratamiento de datos, requerido por el Artículo 28 del GDPR. Especifica el objeto, duración, naturaleza, finalidad y tipo de tratamiento de datos personales, así como los derechos y obligaciones de ambas partes.
#dpaDPIA
Evaluación de Impacto en la Protección de Datos
Proceso de evaluación de riesgos requerido por el Artículo 35 del GDPR para actividades de tratamiento que probablemente impliquen altos riesgos para los derechos y libertades de las personas. Obligatorio para la elaboración de perfiles sistemática, el tratamiento a gran escala de PHI y la vigilancia en espacios públicos.
#dpiaE
e-Discovery
Descubrimiento Electrónico
El proceso de identificar, recopilar y producir información almacenada electrónicamente en procedimientos legales. Requiere la redacción de PII e información privilegiada en los documentos producidos. Es un caso de uso principal para los departamentos legales que utilizan anonym.legal.
#ediscoveryE2EE
Cifrado de Extremo a Extremo
Cifrado en el que solo las partes comunicantes pueden leer los mensajes; el proveedor de servicios no tiene acceso al texto claro. En el modo ZK Auth de anonym.legal, las claves de cifrado nunca salen del dispositivo del cliente, logrando E2EE para el almacenamiento de salidas anonimizadas.
#e2eeEntidades de Salud
Tipos de Entidad PII de Salud
Tipos de entidades para los 18 identificadores Safe Harbor de HIPAA y PII adicionales relacionados con la salud: US_MRN (números de historia clínica), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY y entidades de contexto de diagnóstico/tratamiento.
#healthcareentitiesEntidades Financieras
Tipos de Entidad PII Financieros
Tipos de entidades que cubren identificadores financieros: CREDIT_CARD (suma de comprobación Luhn), IBAN_CODE (suma de comprobación ISO 13616), SWIFT_CODE (formato BIC), US_BANK_NUMBER, NRP (identificación fiscal española). Detectados con validación de suma de comprobación para minimizar falsos positivos.
#financialentitiesEntidades Personalizadas
Reconocedores de Entidades Personalizadas
Patrones de PII definidos por el usuario que se agregan a los más de 285 tipos de entidades integrados de anonym.legal. Admite patrones regex, listas de palabras y listas de denegación. Útil para identificadores específicos de la organización como IDs de empleados, códigos internos de proyectos o nombres de productos propietarios.
#customentitiesEntidades Universales
Tipos de Entidad Universales por Idioma
Tipos de entidades detectadas independientemente del idioma del texto, normalmente mediante expresiones regulares basadas en formato con validación de suma de comprobación. Ejemplos: CREDIT_CARD, IBAN_CODE, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS, URL, dirección CRYPTO.
#universalentitiesExtensión de Chrome
Extensión de Chrome de anonym.legal
Extensión de navegador (Manifest V3) que intercepta texto antes de enviarlo a chatbots de IA (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonimiza en tiempo real y opcionalmente descifra respuestas de IA usando claves de cifrado guardadas.
#chromeextensionF
FOIA
Ley de Libertad de Información
Ley federal de EE. UU. (y estatutos equivalentes en otras jurisdicciones) que otorga acceso público a registros gubernamentales. Exige la redacción de PII y otra información exenta antes de la divulgación — un caso de uso principal para flujos de trabajo de anonimización en el ámbito legal y gubernamental.
#foiaG
GDPR
Reglamento General de Protección de Datos
Reglamento de la UE 2016/679, el principal marco de protección de datos de la Unión Europea. Aplica a cualquier organización que procese datos personales de residentes de la UE. Sanciones de hasta 20 millones de euros o el 4% de la facturación anual global. Derechos clave: acceso, supresión, portabilidad, restricción, oposición.
#gdprGDPR Article 25
GDPR Artículo 25 — Protección de Datos desde el Diseño y por Defecto
Exige que los responsables implementen medidas técnicas y organizativas apropiadas (como la seudonimización y la minimización de datos) tanto en el momento del diseño del sistema como por defecto durante el tratamiento.
#gdprarticle25GDPR Article 32
GDPR Artículo 32 — Seguridad del Tratamiento
Exige que responsables y encargados implementen medidas técnicas y organizativas apropiadas para garantizar un nivel de seguridad adecuado al riesgo, incluyendo cifrado, seudonimización, confidencialidad, integridad, disponibilidad y resiliencia de los sistemas de tratamiento.
#gdprarticle32GenAI DLP
Prevención de Pérdida de Datos en IA Generativa
Categoría DLP especializada en evitar que PII y datos confidenciales se incluyan en indicaciones enviadas a modelos de IA generativa (ChatGPT, Claude, Gemini). La Extensión de Chrome y el Servidor MCP de anonym.legal abordan este riesgo en el punto de entrada.
#genaidlpH
Hashing
Hashing Criptográfico
Transformación unidireccional de datos en un resumen de longitud fija utilizando algoritmos como SHA-256. Se utiliza para seudonimización consistente, deduplicación y verificación de integridad. Los valores hash no pueden revertirse, pero pueden ser vulnerables a ataques de tablas arcoíris si no se utiliza sal.
#hashingHetzner
Hetzner Online GmbH
Proveedor alemán de servicios cloud y hosting donde se ejecuta la infraestructura de producción de anonym.legal. Ubicado en Falkenstein, Sajonia (centro de datos fsn1) con certificación ISO 27001. Elegido por la residencia de datos en la UE, postura de cumplimiento y jurisdicción favorable al GDPR bajo la ley alemana.
#hetznerHIPAA
Ley de Portabilidad y Responsabilidad de Seguros de Salud
Ley federal de EE. UU. que establece estándares para la protección de información médica sensible de los pacientes. La Regla de Privacidad regula el uso de PHI; la Regla de Seguridad exige salvaguardas administrativas, físicas y técnicas para PHI electrónica (ePHI). Las infracciones pueden conllevar multas de hasta 1,9 millones de dólares por categoría y año.
#hipaaHIPAA Safe Harbor
Método de Desidentificación Safe Harbor de HIPAA
Uno de los dos métodos de desidentificación aprobados por HIPAA que exige la eliminación de los 18 identificadores especificados del paciente (nombre, dirección, fechas, números de teléfono, SSN, correo electrónico, dirección IP, biometría, etc.) para que los datos de salud no sean identificables individualmente.
#hipaasafeharborHSTS
HTTP Strict Transport Security
Un mecanismo de política de seguridad web que obliga a los navegadores a usar solo conexiones HTTPS. anonym.legal establece Strict-Transport-Security: max-age=31536000; includeSubDomains para prevenir ataques de degradación de protocolo y secuestro de cookies.
#hstsHybrid Detection
Detección Híbrida NLP + Regex + ML
El enfoque de tres capas de anonym.legal: patrones regex para PII estructurada (números de teléfono, IBANs, tarjetas de crédito), modelos NLP/NER para entidades contextuales (nombres, organizaciones, ubicaciones) y clasificadores ML para casos ambiguos. Reduce tanto los falsos positivos como los falsos negativos.
#hybriddetectionI
Identificación Gubernamental
Tipos de Entidad de Identificadores Gubernamentales
Tipos de entidades para identificadores nacionales y emitidos por gobiernos: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE y más de 50 formatos de identificación específicos de países. Detectados mediante patrones regex y suma de comprobación específicos de cada país.
#governmentidIdentificadores de Seguro
Tipos de Entidad de Seguro
Tipos de entidades para identificadores relacionados con seguros: US_NPI (Identificador Nacional de Proveedor para proveedores de salud), HEALTHCARE_PLAN_BENEFICIARY y números de seguro de salud específicos de cada país (por ejemplo, DE_HEALTH_INSURANCE_NUMBER).
#insuranceidentifiersIdentificadores de Vehículos
Tipos de Entidad de Vehículos
Tipos de entidades para identificadores relacionados con vehículos: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (Número de Identificación del Vehículo) y formatos de matrícula específicos de cada país.
#vehicleidentifiersIdentificadores Digitales
Tipos de Entidad de Identidad Digital
Tipos de entidades para identificadores digitales y en línea: EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS (IPv4 e IPv6), URL, DOMAIN_NAME, CRYPTO (direcciones Bitcoin/Ethereum) e identificadores específicos de plataformas.
#digitalidentifiersISO 27001
Gestión de Seguridad de la Información ISO/IEC 27001
Norma internacional para sistemas de gestión de seguridad de la información (ISMS). La certificación requiere políticas documentadas, evaluaciones de riesgos y controles. Los servidores de la UE de anonym.legal cuentan con certificación ISO 27001, garantizando una gobernanza de seguridad estructurada.
#iso27001ISO 27001 SoA
Declaración de Aplicabilidad
Documento obligatorio de ISO 27001 que enumera todos los controles del Anexo A, indicando cuáles son aplicables a la organización y proporcionando justificación para inclusiones y exclusiones. Requerido para la certificación y auditorías.
#iso27001soaJ
JWT
JSON Web Token
Un formato de token compacto y seguro para URL, utilizado para transmitir afirmaciones entre partes. anonym.legal utiliza JWTs firmados con HS256 para autenticación interna entre servicios (por ejemplo, frontend → Presidio API). Los tokens son de corta duración y se validan en el servidor.
#jwtK
KEK
Clave de Cifrado de Claves
Una clave utilizada para cifrar otras claves en lugar de datos directamente. En la arquitectura ZK de anonym.legal, la clave derivada de la frase secreta del usuario actúa como KEK para proteger las claves de cifrado por documento almacenadas en la bóveda cifrada.
#kekL
Language Detection
Detección Automática de Idioma
La identificación automática del idioma del texto de entrada antes del análisis de PII. anonym.legal detecta el idioma a nivel de solicitud y enruta a la pipeline de modelo NER apropiada, con inglés como respaldo para idiomas no soportados.
#languagedetectionLimitación de Tasa
Limitación de Tasa de la API
Controles sobre el número de solicitudes API que un cliente puede realizar en una ventana de tiempo. Previene abusos y garantiza una asignación justa de recursos. anonym.legal aplica límites de tasa por usuario según el nivel del plan, recomendando retroceso exponencial para la lógica de reintentos.
#ratelimitingM
Masking
Enmascaramiento de Datos
Sustitución de valores sensibles por datos ficticios pero realistas que conservan el formato y la estructura. Se utiliza en entornos de pruebas, análisis y para compartir conjuntos de datos sin exponer PII real.
#maskingMCP
Model Context Protocol
Un protocolo abierto desarrollado por Anthropic que permite a los modelos de IA interactuar con herramientas externas y fuentes de datos de manera estandarizada. anonym.legal implementa un Servidor MCP para que las herramientas de codificación de IA puedan invocar la anonimización sin salir de su flujo de trabajo.
#mcpML Models
Modelos de Aprendizaje Automático para Detección de PII
Modelos estadísticos entrenados en corpus de texto etiquetados para reconocer PII en contexto. anonym.legal utiliza tanto pipelines de transformadores de spaCy como XLM-RoBERTa ajustado para reconocimiento de entidades multilingüe a escala de producción.
#mlmodelsN
NER
Reconocimiento de Entidades Nombradas
Una tarea de procesamiento de lenguaje natural que identifica y clasifica entidades nombradas en un texto en categorías predefinidas como personas, organizaciones, ubicaciones, fechas e identificadores médicos. La técnica principal de ML que impulsa la detección de PII en anonym.legal.
#nerNIS2
Directiva de Seguridad de Redes y Sistemas de Información 2
Directiva de la UE 2022/2555 que amplía la Directiva NIS original para cubrir más sectores (sanidad, energía, transporte, infraestructura digital) y refuerza los requisitos de ciberseguridad. El plazo de transposición fue el 17 de octubre de 2024; la mayoría de los estados miembros de la UE no lo cumplieron y la Comisión Europea inició procedimientos de infracción contra los estados no conformes.
#nis2NLP
Procesamiento de Lenguaje Natural
Una rama de la inteligencia artificial que se ocupa de la interacción entre computadoras y el lenguaje humano. En la detección de PII, los modelos de NLP comprenden el contexto, la gramática y la semántica para identificar entidades que los patrones de regex por sí solos no detectarían.
#nlpO
Operadores
Operadores de Anonimización
La estrategia de reemplazo aplicada a la PII detectada. anonym.legal admite REPLACE (texto de marcador de posición), REDACT (cadena vacía), MASK (asteriscos), HASH (resumen SHA-256), ENCRYPT (AES-256-GCM reversible) y CUSTOM (reemplazo definido por el usuario).
#operatorsP
PCI DSS
Estándar de Seguridad de Datos para la Industria de Tarjetas de Pago
Estándar de seguridad para organizaciones que manejan datos de tarjetas de pago, mantenido por el PCI Security Standards Council. Requiere cifrado, controles de acceso, registros y pruebas periódicas. El incumplimiento puede resultar en multas y pérdida de privilegios de procesamiento de tarjetas.
#pcidssPHI
Información de Salud Protegida
Cualquier información relacionada con la salud vinculada a una persona identificable, regulada por HIPAA en EE. UU. Incluye diagnósticos, registros de tratamientos, datos de seguros y cualquiera de los 18 identificadores Safe Harbor de HIPAA.
#phiPII
Información de Identificación Personal
Cualquier dato que pueda identificar a una persona específica, ya sea directamente o en combinación con otros datos. Ejemplos: nombres, direcciones de correo electrónico, números de seguridad social, direcciones IP, registros biométricos.
#piiPreajustes
Preajustes de Anonimización
Configuraciones guardadas de tipos de entidades seleccionadas, umbrales de confianza y opciones de salida que pueden aplicarse con un solo clic. Los preajustes se sincronizan entre la Aplicación Web, el Complemento de Office y la Aplicación de Escritorio mediante almacenamiento en la nube cifrado.
#presetsPresidio
Microsoft Presidio
Un SDK de protección y anonimización de datos de código abierto de Microsoft. El motor de detección de anonym.legal está construido sobre los servicios de análisis y anonimización de Presidio, ampliado con más de 285 reconocedores de entidades personalizados en 48 idiomas.
#presidioPresidio Analyzer
Microsoft Presidio Analyzer Service
El componente de detección del backend de anonym.legal (puerto 8011). Recibe texto y devuelve una lista de entidades PII detectadas con sus posiciones, tipos y puntuaciones de confianza. Ampliado con más de 285 reconocedores personalizados en 48 idiomas.
#presidioanalyzerPresidio Anonymizer
Microsoft Presidio Anonymizer Service
El componente de transformación del backend de anonym.legal (puerto 8012). Toma texto y resultados del analizador como entrada, aplica el operador seleccionado (REPLACE, REDACT, MASK, HASH, ENCRYPT) a cada entidad detectada y devuelve el texto anonimizado.
#presidioanonymizerPrivacy by Design
Privacidad desde el Diseño y por Defecto
El principio, exigido por el GDPR Artículo 25, de que las medidas de protección de datos se integran en los sistemas desde el inicio y no como una adición posterior. Incluye minimización de datos, controles de acceso, cifrado y seudonimización a nivel de arquitectura.
#privacybydesignPrivilegio Abogado-Cliente
Protección del Privilegio Abogado-Cliente
Protección legal para las comunicaciones confidenciales entre abogados y clientes. En la revisión de documentos y e-discovery, el contenido privilegiado debe ser identificado y retenido o redactado. Los tipos de entidad personalizados en anonym.legal pueden configurarse para marcar indicadores de contenido privilegiado.
#attorneyclientprivilegeProcesamiento por Lotes
Anonimización de Archivos por Lotes
Procesamiento simultáneo de múltiples archivos en una sola operación. El modo por lotes de anonym.legal admite archivos PDF, DOCX y TXT con configuración de entidades por archivo, umbrales de confianza y selección de formato de salida.
#batchprocessingProtección DDoS
Protección contra Denegación de Servicio Distribuida
Defensas a nivel de infraestructura contra ataques de denegación de servicio distribuida. La infraestructura de servidores de anonym.legal incluye reglas de firewall (UFW), límites de conexión en nginx y protecciones equivalentes a Cloudflare aguas arriba para mantener la disponibilidad.
#ddosprotectionPseudonymization
Seudonimización de Datos
Sustitución de identificadores directos por valores artificiales (seudónimos), manteniendo la posibilidad de reidentificar a las personas mediante una clave separada. El GDPR Artículo 4(5) la reconoce como una técnica que mejora la privacidad, pero no exime a los datos seudonimizados de la regulación.
#pseudonymizationR
Redacción Excesiva
Redacción Excesiva (Falsos Positivos)
Eliminar más información de la necesaria, reduciendo la utilidad del documento y pudiendo constituir destrucción de pruebas en procedimientos legales. Causado por umbrales de confianza bajos o selección de entidades demasiado amplia. Ajustable mediante los controles de umbral y entidades de anonym.legal.
#overredactionRedacción Insuficiente
Redacción Insuficiente (Falsos Negativos)
No eliminar toda la PII, dejando a las personas expuestas en documentos compartidos. Es el riesgo de cumplimiento más común. Causado por umbrales de confianza altos, tipos de entidad ausentes o formatos de PII novedosos. Se mitiga mediante la detección híbrida y el soporte de entidades personalizadas de anonym.legal.
#underredactionRedaction
Redacción de Datos
Eliminación u ocultación permanente de información sensible en documentos, reemplazándola por un marcador visual como [REDACTED] o una barra negra. A diferencia del cifrado, la redacción es un proceso irreversible y los datos originales no pueden recuperarse.
#redactionRedactor de Imágenes
Presidio Image Redactor Service
Un servicio backend especializado (puerto 8013) que detecta y redacta PII de archivos de imagen (PNG, JPEG) usando OCR y análisis Presidio. Aplica una barra negra sobre las regiones de PII detectadas en la imagen original.
#presidioimageredactorRegex
Coincidencia de Patrones con Expresiones Regulares
Coincidencia de texto basada en patrones utilizando sintaxis de lenguaje formal. En la detección de PII, regex gestiona identificadores estructuralmente predecibles (números de teléfono, tarjetas de crédito, IBANs, direcciones de correo electrónico) con validación de suma de comprobación. Complementa NER para una detección híbrida.
#regexRegistro de Auditoría
Registro de Auditoría Inmutable
Un registro secuencial e inalterable que documenta quién accedió, modificó o procesó los datos y cuándo. Requerido por ISO 27001 (A.8.15), HIPAA Security Rule (§164.312(b)) y normas de e-discovery. anonym.legal registra todas las operaciones de anonimización con marcas de tiempo, recuentos de entidades e identificadores de operador.
#audittrailRegla 26
Federal Rules of Civil Procedure Rule 26
Regla del procedimiento civil de EE. UU. que regula las obligaciones de descubrimiento. Rule 26(g) exige que los abogados certifiquen que las solicitudes y divulgaciones de descubrimiento no se realizan con fines indebidos, incluyendo la omisión de redactar correctamente la PII en los documentos producidos.
#rule26Residencia de Datos en la UE
Residencia de Datos en la Unión Europea
La garantía de que los datos se almacenan y procesan exclusivamente dentro del territorio de la UE/EEE. Los servidores de producción de anonym.legal están en Alemania (Hetzner Frankfurt), asegurando que todo el procesamiento se realiza bajo jurisdicción GDPR sin implicaciones de transferencia transfronteriza de datos.
#eudataresidencyREST API
API RESTful
anonym.legal expone una API HTTP RESTful para integración programática. Los endpoints incluyen /api/analyze, /api/anonymize, /api/image y /api/structured. Autenticada mediante tokens JWT bearer. Documentación OpenAPI completa disponible en la Referencia de API.
#restapiS
SCCs
Cláusulas Contractuales Tipo
Cláusulas contractuales preaprobadas y conformes con el GDPR para transferir datos personales desde la UE/EEE a terceros países. Actualizadas por la Comisión Europea en 2021 (2021/914/UE) para abordar los requisitos de Schrems II, incluyendo una Evaluación de Impacto de Transferencia.
#sccsSchrems II
Sentencia Schrems II (C-311/18)
Sentencia de 2020 del Tribunal de Justicia de la UE que invalida el marco Privacy Shield UE-EE. UU. para transferencias transatlánticas de datos, citando protecciones insuficientes en la legislación de vigilancia de EE. UU. Requiere medidas suplementarias (cifrado, anonimización) al utilizar Cláusulas Contractuales Tipo.
#schremsiiServidor MCP
Servidor Model Context Protocol
La integración del Servidor MCP de anonym.legal permite que asistentes de codificación de IA (Claude Desktop, Cursor, VS Code Copilot) llamen directamente a la API de anonimización como herramienta. La PII se elimina del código, indicaciones y contexto antes de enviarse al modelo de IA.
#mcpserverSHA-256
Algoritmo de Hash Seguro de 256 bits
Una función hash criptográfica que produce un resumen de 256 bits. Utilizada en anonym.legal para autenticación HMAC de solicitudes API, pruebas de ZK auth y seudonimización consistente de entidades (el hash con sal produce el mismo reemplazo para el mismo valor original).
#sha256Sistema de Tokens
Sistema de Créditos por Tokens de anonym.legal
Facturación basada en uso donde las llamadas a la API consumen tokens calculados según la longitud del texto, el número de entidades y el modo de procesamiento (analizar vs. anonimizar). Los costos de tokens son configurables en la base de datos y se muestran en tiempo real antes del procesamiento.
#tokensystemspaCy
Librería NLP spaCy
Librería de NLP de código abierto y nivel industrial en Python. anonym.legal utiliza los modelos basados en transformadores de spaCy para 24 idiomas (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko, y más) para el reconocimiento de entidades nombradas en la pipeline de Presidio.
#spacyStanza
Librería NLP Stanza (Stanford NLP)
Kit de herramientas NLP en Python del Stanford NLP Group que soporta más de 70 idiomas con modelos neuronales de última generación. Se utiliza como backend NER complementario en anonym.legal para idiomas no cubiertos por los modelos de spaCy.
#stanzaT
Tipo de Entidad
Tipo de Entidad PII
Una categoría de información personal que el motor de detección reconoce y puede anonimizar. Ejemplos: PERSON, EMAIL_ADDRESS, PHONE_NUMBER, CREDIT_CARD, IBAN_CODE, US_SSN, IP_ADDRESS. anonym.legal admite más de 285 tipos de entidades en 48 idiomas.
#entitytypeTLS
Transport Layer Security
El protocolo criptográfico que protege los datos en tránsito. anonym.legal aplica TLS 1.2 como mínimo con preferencia por TLS 1.3, HSTS con max-age de un año y HTTP/2. Todo el tráfico entre clientes y el servidor está cifrado en tránsito.
#tlsTokenization
Tokenización de Datos
Sustitución de datos sensibles por un marcador no sensible (token) que se asocia al original en un almacén seguro. A diferencia del cifrado, el token en sí no tiene relación matemática con los datos originales.
#tokenizationX
XChaCha20
XChaCha20-Poly1305
Un algoritmo de cifrado autenticado que ofrece alto rendimiento en sistemas sin aceleración de hardware AES. Utiliza un nonce de 192 bits (extendido del nonce de 96 bits del estándar IETF ChaCha20 según RFC 8439), eliminando riesgos de colisión de nonce. Se utiliza como cifrado alternativo en la capa de cifrado de anonym.legal.
#xchacha20XLM-RoBERTa
RoBERTa Multilingüe
Un modelo de lenguaje transformador multilingüe entrenado en 100 idiomas, desarrollado por Meta AI. Utilizado en anonym.legal para tareas de NER multilingüe, especialmente para tipos de entidades e idiomas donde no hay modelos monolingües disponibles.
#xlmrobertaZ
Zero-Knowledge
Arquitectura Zero-Knowledge
Un diseño de sistema en el que el proveedor de servicios no tiene acceso alguno a los datos en texto claro de los usuarios ni a sus claves de cifrado. Todo el cifrado/descifrado ocurre del lado del cliente; el servidor nunca ve el contenido original. Previene amenazas internas y divulgaciones forzadas.
#zeroknowledgeZK Auth
Autenticación Zero-Knowledge
El sistema de autenticación de anonym.legal donde las claves de cifrado se derivan en el lado del cliente a partir de la frase secreta del usuario usando Argon2id, sin ser nunca transmitidas ni almacenadas en el servidor. El servidor almacena solo una prueba criptográfica, no la clave ni la frase secreta.
#zkauth