Docs/Glossary

Glossário de Privacidade & Tecnologia

Definições de todos os termos, siglas e conceitos usados em anonimização de PII e privacidade de dados.

Voltar para Documentação

94 termos

2

2FA

Autenticação em Dois Fatores

Criptografia & Segurança

Autenticação que requer dois fatores de verificação distintos: algo que o usuário sabe (senha) e algo que o usuário possui (aplicativo TOTP, chave física) ou é (biometria). Suportado na anonym.legal como camada adicional sobre o ZK Auth.

#twofa

A

AES-256-GCM

Padrão Avançado de Criptografia 256-bit Galois/Counter Mode

Criptografia & Segurança

Um algoritmo de criptografia autenticada que combina AES-256 (chave de 256 bits) com Galois/Counter Mode para garantir confidencialidade e integridade. Utilizado na anonimização reversível da anonym.legal para criptografar entidades substituídas. Proporciona sigilo e detecção de adulteração.

#aes256gcm

Anonymization

Anonimização de Dados

Privacidade de Dados & PII

O processo irreversível de remoção ou transformação de informações identificadoras de modo que os indivíduos não possam mais ser identificados, direta ou indiretamente. Segundo o GDPR, dados verdadeiramente anonimizados ficam fora do escopo da regulamentação.

#anonymization

Argon2id

Função de Derivação de Chave Argon2id

Criptografia & Segurança

Vencedor da Password Hashing Competition de 2015. Argon2id combina a resistência a ataques de canal lateral do Argon2i com a resistência a GPU do Argon2d. Utilizado na anonym.legal e no cofre do Desktop App para derivar chaves de criptografia a partir de frases secretas dos usuários.

#argon2id

B

Batch Processing

Anonimização de Arquivos em Lote

Plataforma & Produtos

Processamento de múltiplos arquivos simultaneamente em uma única operação. O modo em lote do anonym.legal suporta arquivos PDF, DOCX e TXT com configuração de entidades por arquivo, limiares de confiança e seleção do formato de saída.

#batchprocessing

BIP39

Bitcoin Improvement Proposal 39 — Frases Mnemônicas

Criptografia & Segurança

Um padrão para gerar frases mnemônicas legíveis por humanos (12–24 palavras) a partir de uma semente criptográfica. Utilizado no cofre do Desktop App da anonym.legal como backup amigável ao usuário para a chave de criptografia derivada via Argon2id.

#bip39

C

CCPA

Lei de Privacidade do Consumidor da Califórnia

Conformidade & Regulamentações

Lei de privacidade da Califórnia que concede aos residentes o direito de saber, excluir e optar pela não venda de suas informações pessoais. Aplica-se a empresas que atendam a critérios de faturamento, volume de dados ou venda de dados. Significativamente alterada pela CPRA (aprovada em novembro de 2020, em vigor em janeiro de 2023).

#ccpa

Chrome Extension

Extensão Chrome anonym.legal

Plataforma & Produtos

Extensão de navegador (Manifest V3) que intercepta texto antes de ser enviado para chatbots de IA (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonimiza em tempo real e, opcionalmente, descriptografa respostas de IA usando chaves de criptografia salvas.

#chromeextension

CLOUD Act

Lei de Esclarecimento do Uso Lícito de Dados no Exterior

Conformidade & Regulamentações

Lei federal dos EUA (2018) que permite que autoridades dos EUA exijam que provedores de nuvem sediados nos EUA forneçam dados armazenados no exterior. Conflita com as regras de transferência de dados do GDPR para residentes da UE. Anonimizar dados antes do upload para a nuvem é uma mitigação comum.

#cloudact

Code-Switching

Alternância de Código Multilíngue

Tecnologia de Detecção

O fenômeno de misturar dois ou mais idiomas em um único texto ou conversa. Comum em documentos multilíngues (por exemplo, documentos jurídicos alemães com termos técnicos em inglês). A detecção híbrida do anonym.legal lida com textos com alternância de código aplicando múltiplos modelos de idioma simultaneamente.

#codeswitching

Confidence Scoring

Pontuação de Confiança na Detecção de Entidades

Tecnologia de Detecção

Uma pontuação de 0 a 1 que indica o quão certo o modelo de detecção está de que um trecho de texto é uma entidade PII. O anonym.legal disponibiliza limiares de confiança configuráveis para que os usuários possam ajustar o equilíbrio entre precisão e abrangência conforme o caso de uso.

#confidencescoring

CSP

Content Security Policy

Criptografia & Segurança

Um mecanismo de cabeçalho de resposta HTTP e meta tag que restringe quais recursos (scripts, estilos, imagens) um navegador pode carregar. A CSP da anonym.legal inclui object-src 'none', script-src com nonces e upgrade-insecure-requests para prevenir ataques XSS.

#csp

Custom Entities

Reconhecedores de Entidades Personalizadas

Plataforma & Produtos

Padrões de PII definidos pelo usuário adicionados aos mais de 285 tipos de entidades nativos do anonym.legal. Suporta padrões regex, listas de palavras e listas de bloqueio. Útil para identificadores específicos da organização, como IDs de funcionários, códigos internos de projetos ou nomes de produtos proprietários.

#customentities

D

Data Minimization

Princípio de Minimização de Dados do GDPR

Privacidade de Dados & PII

Princípio do GDPR Artigo 5(1)(c) que exige que apenas dados adequados, relevantes e necessários para a finalidade especificada sejam coletados e processados. Uma restrição central de design para sistemas em conformidade com a privacidade.

#dataminimization

Data Residency

Requisitos de Residência de Dados

Conformidade & Regulamentações

Requisitos legais ou contratuais que especificam em qual localização geográfica os dados devem ser armazenados e processados. Relevante para GDPR (transferências de dados fora do EEE), BDSG alemão e regulamentos setoriais em saúde e finanças.

#dataresidency

Data Sovereignty

Soberania Digital dos Dados

Conformidade & Regulamentações

Princípio de que os dados estão sujeitos às leis e estruturas de governança do país em que são coletados. Mais amplo que residência de dados, abrange o controle sobre quem pode acessar os dados e sob qual estrutura legal.

#datasovereignty

De-anonymization

Ataque de Reidentificação

Privacidade de Dados & PII

O processo de reidentificação de indivíduos a partir de conjuntos de dados supostamente anonimizados, por meio do cruzamento com informações auxiliares. Um risco importante ao compartilhar dados com anonimização insuficiente.

#deanonymization

Defensibilidade

Anonimização Juridicamente Defensável

Jurídico & Auditoria

A capacidade de demonstrar a reguladores, tribunais ou auditores que a anonimização foi realizada utilizando uma metodologia documentada, consistente e tecnicamente sólida. Os logs de auditoria, pontuações de confiança e configurações de operador do anonym.legal suportam fluxos de trabalho de anonimização defensáveis.

#defensibility

Desktop App

Aplicação Desktop anonym.legal

Plataforma & Produtos

Aplicação multiplataforma (Windows, macOS, Linux) desenvolvida com Tauri 2.0 e React 18. Possui processamento local de arquivos, cofre BIP39 para ZK Auth offline, exportação em lote e sincronização via API. Suporta implantações isoladas (air-gapped) sem acesso à internet.

#desktopapp

Differential Privacy

Privacidade Diferencial (DP)

Privacidade de Dados & PII

Uma estrutura matemática para divulgar informações estatísticas sobre conjuntos de dados, fornecendo garantias comprováveis de que os dados de qualquer indivíduo não podem ser distinguidos. Utilizada em análises agregadas para evitar reidentificação mesmo ao consultar resultados agregados.

#differentialprivacy

DLP

Prevenção de Perda de Dados

Plataforma & Produtos

Disciplina de segurança e categoria de ferramentas de software que detectam e previnem a transmissão não autorizada de dados sensíveis para fora de uma organização. O anonym.legal atua como uma solução DLP na camada do navegador e da IA para PII.

#dlp

Documento de Identificação Governamental

Tipos de Entidade de Identificadores Governamentais

Tipos de Entidade

Tipos de entidades para identificadores nacionais e emitidos por governos: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE e mais de 50 outros formatos de identificação específicos de países. Detectados usando regex e padrões de dígito verificador específicos de cada país.

#governmentid

DPA

Acordo de Processamento de Dados

Conformidade & Regulamentações

Contrato juridicamente vinculativo entre um controlador e um processador de dados, exigido pelo Artigo 28 do GDPR. Especifica o objeto, duração, natureza, finalidade e tipo de processamento de dados pessoais, bem como os direitos e obrigações de ambas as partes.

#dpa

DPIA

Avaliação de Impacto à Proteção de Dados

Conformidade & Regulamentações

Processo de avaliação de riscos exigido pelo Artigo 35 do GDPR para atividades de processamento que possam resultar em altos riscos aos direitos e liberdades dos indivíduos. Obrigatório para perfilamento sistemático, processamento em larga escala de PHI e vigilância de áreas públicas.

#dpia

E

e-Discovery

Descoberta Eletrônica

Jurídico & Auditoria

O processo de identificação, coleta e produção de informações eletronicamente armazenadas em processos judiciais. Exige a redação de PII e informações privilegiadas dos documentos produzidos. Um dos principais casos de uso para departamentos jurídicos que utilizam o anonym.legal.

#ediscovery

E2EE

Criptografia de Ponta a Ponta

Criptografia & Segurança

Criptografia na qual apenas as partes comunicantes podem ler as mensagens; o provedor de serviço não tem acesso ao texto claro. No modo ZK Auth da anonym.legal, as chaves de criptografia nunca deixam o dispositivo do cliente, garantindo E2EE para o armazenamento de saídas anonimizadas.

#e2ee

Entidades de Saúde

Tipos de Entidade PII de Saúde

Tipos de Entidade

Tipos de entidades para os 18 identificadores Safe Harbor da HIPAA e PII adicionais relacionados à saúde: US_MRN (números de prontuário médico), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY e entidades de contexto de diagnóstico/tratamento.

#healthcareentities

Entidades Financeiras

Tipos de Entidade PII Financeira

Tipos de Entidade

Tipos de entidades que abrangem identificadores financeiros: CREDIT_CARD (dígito verificador Luhn), IBAN_CODE (dígito verificador ISO 13616), SWIFT_CODE (formato BIC), US_BANK_NUMBER, NRP (NIF espanhol). Detectados com validação de dígito verificador para minimizar falsos positivos.

#financialentities

Entidades Universais

Tipos de Entidade Universais de Idioma

Tipos de Entidade

Tipos de entidades detectados independentemente do idioma do texto, normalmente por meio de regex baseado em formato com validação de dígito verificador. Exemplos: CREDIT_CARD, IBAN_CODE, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS, URL, endereço CRYPTO.

#universalentities

Espoliação

Espoliação de Provas

Jurídico & Auditoria

A destruição, alteração ou falha em preservar provas relevantes para litígios. Redação excessiva que torna documentos ilegíveis pode constituir espoliação. Calibrar a precisão da anonimização (limiares de confiança, seleção de entidades) é importante para uma redação juridicamente defensável.

#spoliation

F

FOIA

Lei de Liberdade de Informação

Conformidade & Regulamentações

Lei federal dos EUA (e estatutos equivalentes em outras jurisdições) que concede acesso público a registros governamentais. Exige a redação de PII e outras informações isentas antes da divulgação — um dos principais casos de uso para fluxos de trabalho de anonimização jurídica e governamental.

#foia

G

GDPR

Regulamento Geral sobre a Proteção de Dados

Conformidade & Regulamentações

Regulamento da UE 2016/679, principal estrutura de proteção de dados da União Europeia. Aplica-se a qualquer organização que processe dados pessoais de residentes da UE. Multas de até €20 milhões ou 4% do faturamento anual global. Direitos principais: acesso, eliminação, portabilidade, restrição, objeção.

#gdpr

GDPR Article 25

GDPR Article 25 — Proteção de Dados desde a Concepção e por Padrão

Conformidade & Regulamentações

Exige que os controladores implementem medidas técnicas e organizacionais apropriadas (como pseudonimização e minimização de dados) tanto no momento do design do sistema quanto por padrão durante o processamento.

#gdprarticle25

GDPR Article 32

GDPR Article 32 — Segurança do Processamento

Conformidade & Regulamentações

Exige que controladores e processadores implementem medidas técnicas e organizacionais apropriadas para garantir um nível de segurança adequado ao risco, incluindo criptografia, pseudonimização, confidencialidade, integridade, disponibilidade e resiliência dos sistemas de processamento.

#gdprarticle32

GenAI DLP

Prevenção de Perda de Dados em IA Generativa

Plataforma & Produtos

Categoria especializada de DLP focada em evitar que PII e dados confidenciais sejam incluídos em prompts enviados para modelos de IA generativa (ChatGPT, Claude, Gemini). A Extensão Chrome e o MCP Server do anonym.legal abordam esse risco no ponto de entrada.

#genaidlp

H

Hashing

Hash Criptográfico

Privacidade de Dados & PII

Transformação unidirecional de dados em um resumo de comprimento fixo usando algoritmos como SHA-256. Utilizado para pseudonimização consistente, deduplicação e verificação de integridade. Os valores de hash não podem ser revertidos, mas podem ser vulneráveis a ataques de rainbow table se não forem salteados.

#hashing

Hetzner

Hetzner Online GmbH

Infraestrutura

Provedor alemão de cloud e hospedagem onde a infraestrutura de produção do anonym.legal está hospedada. Localizado em Falkenstein, Saxônia (datacenter fsn1) com certificação ISO 27001. Escolhido por garantir residência de dados na UE, postura de conformidade e jurisdição favorável à GDPR sob a lei alemã.

#hetzner

HIPAA

Lei de Portabilidade e Responsabilidade de Seguro de Saúde

Conformidade & Regulamentações

Lei federal dos EUA que estabelece padrões para proteger informações sensíveis de saúde de pacientes. A Regra de Privacidade regula o uso de PHI; a Regra de Segurança exige salvaguardas administrativas, físicas e técnicas para PHI eletrônica (ePHI). Violações podem resultar em multas de até US$ 1,9 milhão por categoria por ano.

#hipaa

HIPAA Safe Harbor

Método de Desidentificação Safe Harbor da HIPAA

Conformidade & Regulamentações

Um dos dois métodos de desidentificação aprovados pela HIPAA, exigindo a remoção de todos os 18 identificadores especificados do paciente (nome, endereço, datas, números de telefone, SSN, e-mail, endereço IP, biometria, etc.) para tornar os dados de saúde não identificáveis individualmente.

#hipaasafeharbor

HSTS

HTTP Strict Transport Security

Criptografia & Segurança

Um mecanismo de política de segurança web que obriga navegadores a utilizarem apenas conexões HTTPS. A anonym.legal define Strict-Transport-Security: max-age=31536000; includeSubDomains para prevenir ataques de downgrade de protocolo e sequestro de cookies.

#hsts

Hybrid Detection

Detecção Híbrida NLP + Regex + ML

Tecnologia de Detecção

A abordagem de três camadas do anonym.legal: padrões regex para PII estruturados (números de telefone, IBANs, cartões de crédito), modelos NLP/NER para entidades contextuais (nomes, organizações, localizações) e classificadores de ML para casos ambíguos. Reduz tanto falsos positivos quanto falsos negativos.

#hybriddetection

I

Identificadores de Seguro

Tipos de Entidade de Seguro

Tipos de Entidade

Tipos de entidades para identificadores relacionados a seguros: US_NPI (Identificador Nacional de Prestador de Serviços de Saúde), HEALTHCARE_PLAN_BENEFICIARY e números de seguro saúde específicos de cada país (ex.: DE_HEALTH_INSURANCE_NUMBER).

#insuranceidentifiers

Identificadores de Veículos

Tipos de Entidade de Veículo

Tipos de Entidade

Tipos de entidades para identificadores relacionados a veículos: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (Número de Identificação do Veículo) e formatos de placas de registro veicular específicos de cada país.

#vehicleidentifiers

Identificadores Digitais

Tipos de Entidade de Identidade Digital

Tipos de Entidade

Tipos de entidades para identificadores online e digitais: EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS (IPv4 e IPv6), URL, DOMAIN_NAME, CRYPTO (endereços Bitcoin/Ethereum) e identificadores específicos de plataformas.

#digitalidentifiers

ISO 27001

Gestão de Segurança da Informação ISO/IEC 27001

Conformidade & Regulamentações

Norma internacional para sistemas de gestão de segurança da informação (ISMS). A certificação exige políticas documentadas, avaliações de risco e controles. Os servidores da UE da anonym.legal são certificados ISO 27001, garantindo uma governança de segurança estruturada.

#iso27001

ISO 27001 SoA

Declaração de Aplicabilidade

Conformidade & Regulamentações

Documento obrigatório da ISO 27001 que lista todos os controles do Anexo A, indicando quais são aplicáveis à organização e fornecendo justificativa para inclusões e exclusões. Necessário para certificação e auditorias.

#iso27001soa

J

JWT

JSON Web Token

Criptografia & Segurança

Um formato compacto e seguro para URLs usado na transmissão de declarações entre partes. A anonym.legal utiliza JWTs assinados com HS256 para autenticação interna entre serviços (por exemplo, frontend → Presidio API). Os tokens têm curta duração e são validados no lado do servidor.

#jwt

K

KEK

Key Encryption Key

Criptografia & Segurança

Uma chave usada para criptografar outras chaves, e não dados diretamente. Na arquitetura ZK da anonym.legal, a chave derivada da frase secreta do usuário atua como KEK para proteger as chaves de criptografia por documento armazenadas no cofre criptografado.

#kek

L

Language Detection

Detecção Automática de Idioma

Tecnologia de Detecção

A identificação automática do idioma do texto de entrada antes da análise de PII. O anonym.legal detecta o idioma no nível da requisição e direciona para a pipeline de modelo NER apropriada, com o inglês como fallback para idiomas não suportados.

#languagedetection

Limitação de Taxa

Limitação de Taxa da API

Infraestrutura

Controles sobre o número de requisições à API que um cliente pode fazer dentro de uma janela de tempo. Prevê abusos e garante alocação justa de recursos. O anonym.legal aplica limites de taxa por usuário conforme o plano, recomendando backoff exponencial para lógica de repetição.

#ratelimiting

M

Masking

Mascaramento de Dados

Privacidade de Dados & PII

Substituição de valores sensíveis por dados fictícios, porém realistas, que preservam o formato e a estrutura. Utilizado em ambientes de teste, análises e compartilhamento de conjuntos de dados sem expor PII real.

#masking

MCP

Model Context Protocol

Plataforma & Produtos

Um protocolo aberto da Anthropic que permite que modelos de IA interajam com ferramentas externas e fontes de dados de forma padronizada. O anonym.legal implementa um MCP Server para que ferramentas de codificação de IA possam invocar a anonimização sem sair do fluxo de trabalho.

#mcp

MCP Server

Servidor Model Context Protocol

Plataforma & Produtos

A integração do MCP Server do anonym.legal permite que assistentes de codificação de IA (Claude Desktop, Cursor, VS Code Copilot) acessem diretamente a API de anonimização como uma ferramenta. PII é removido de códigos, prompts e contexto antes de serem enviados ao modelo de IA.

#mcpserver

ML Models

Modelos de Machine Learning para Detecção de PII

Tecnologia de Detecção

Modelos estatísticos treinados em corpora de texto rotulados para reconhecer PII em contexto. O anonym.legal utiliza pipelines de transformadores spaCy e XLM-RoBERTa ajustados para reconhecimento de entidades multilíngue em escala de produção.

#mlmodels

N

NER

Reconhecimento de Entidades Nomeadas

Tecnologia de Detecção

Uma tarefa de processamento de linguagem natural que identifica e classifica entidades nomeadas em textos em categorias predefinidas, como pessoas, organizações, localizações, datas e identificadores médicos. É a principal técnica de ML que impulsiona a detecção de PII no anonym.legal.

#ner

NIS2

Diretiva de Segurança de Redes e Informação 2

Conformidade & Regulamentações

Diretiva da UE 2022/2555 que expande a diretiva NIS original para cobrir mais setores (saúde, energia, transporte, infraestrutura digital) e reforça os requisitos de cibersegurança. O prazo de transposição foi 17 de outubro de 2024; a maioria dos Estados-Membros da UE não cumpriu e a Comissão Europeia abriu processos de infração contra os estados não conformes.

#nis2

NLP

Processamento de Linguagem Natural

Tecnologia de Detecção

Um ramo da inteligência artificial voltado para a interação entre computadores e a linguagem humana. Na detecção de PII, modelos de NLP compreendem contexto, gramática e semântica para identificar entidades que padrões de regex sozinhos não detectariam.

#nlp

O

Office Add-in

Complemento Microsoft Office anonym.legal

Plataforma & Produtos

Extensão para Microsoft Office que integra a anonimização de PII diretamente no Word, Excel e PowerPoint. Suporta redação no documento, gerenciamento de predefinições, ZK Auth e sincronização entre dispositivos. Disponível no Microsoft AppSource.

#officeaddin

Operators

Operadores de Anonimização

Plataforma & Produtos

A estratégia de substituição aplicada ao PII detectado. O anonym.legal suporta REPLACE (texto de substituição), REDACT (string vazia), MASK (asteriscos), HASH (digest SHA-256), ENCRYPT (AES-256-GCM reversível) e CUSTOM (substituição definida pelo usuário).

#operators

P

PCI DSS

Padrão de Segurança de Dados da Indústria de Cartões de Pagamento

Conformidade & Regulamentações

Padrão de segurança para organizações que lidam com dados de cartões de pagamento, mantido pelo PCI Security Standards Council. Exige criptografia, controles de acesso, registros e testes regulares. A não conformidade pode resultar em multas e perda do direito de processar cartões.

#pcidss

PHI

Informação de Saúde Protegida

Privacidade de Dados & PII

Qualquer informação relacionada à saúde vinculada a um indivíduo identificável, regulamentada pela HIPAA nos EUA. Inclui diagnósticos, registros de tratamento, dados de seguro e qualquer um dos 18 identificadores do Safe Harbor da HIPAA.

#phi

PII

Informação Pessoalmente Identificável

Privacidade de Dados & PII

Qualquer dado que possa identificar um indivíduo específico, direta ou indiretamente, isoladamente ou em combinação com outros dados. Exemplos: nomes, endereços de e-mail, números de segurança social, endereços IP, registros biométricos.

#pii

Presets

Predefinições de Anonimização

Plataforma & Produtos

Configurações salvas de tipos de entidades selecionadas, limiares de confiança e opções de saída que podem ser aplicadas com um clique. As predefinições são sincronizadas entre Web App, Office Add-in e Desktop App via armazenamento em nuvem criptografado.

#presets

Presidio

Microsoft Presidio

Tecnologia de Detecção

SDK open-source de proteção e anonimização de dados da Microsoft. O mecanismo de detecção do anonym.legal é construído sobre os serviços de análise e anonimização do Presidio, estendido com mais de 285 reconhecedores de entidades personalizados em 48 idiomas.

#presidio

Presidio Analyzer

Serviço Microsoft Presidio Analyzer

Infraestrutura

O componente de detecção do backend do anonym.legal (porta 8011). Aceita texto e retorna uma lista de entidades PII detectadas com suas posições, tipos e pontuações de confiança. Estendido com mais de 285 reconhecedores personalizados em 48 idiomas.

#presidioanalyzer

Presidio Anonymizer

Serviço Microsoft Presidio Anonymizer

Infraestrutura

O componente de transformação do backend do anonym.legal (porta 8012). Recebe texto e resultados do analyzer como entrada, aplica o operador selecionado (REPLACE, REDACT, MASK, HASH, ENCRYPT) a cada entidade detectada e retorna o texto anonimizado.

#presidioanonymizer

Privacy by Design

Privacidade por Design e por Padrão

Privacidade de Dados & PII

O princípio, exigido pelo GDPR Artigo 25, de que medidas de proteção de dados sejam incorporadas aos sistemas desde o início, e não adicionadas posteriormente. Engloba minimização de dados, controles de acesso, criptografia e pseudonimização no nível da arquitetura.

#privacybydesign

Proteção DDoS

Proteção contra Ataques de Negação de Serviço Distribuída

Infraestrutura

Defesas em nível de infraestrutura contra ataques distribuídos de negação de serviço. A infraestrutura de servidores do anonym.legal inclui regras de firewall (UFW), limites de conexão nginx e proteções upstream equivalentes ao Cloudflare para manter a disponibilidade.

#ddosprotection

Pseudonymization

Pseudonimização de Dados

Privacidade de Dados & PII

Substituição de identificadores diretos por valores artificiais (pseudônimos), mantendo a possibilidade de reidentificar os indivíduos por meio de uma chave separada. O GDPR Artigo 4(5) reconhece como uma técnica de aprimoramento de privacidade, mas não isenta os dados pseudonimizados da regulamentação.

#pseudonymization

R

Redação Excessiva

Redação Excessiva (Falsos Positivos)

Jurídico & Auditoria

Remover mais informações do que o necessário, reduzindo a utilidade do documento e podendo constituir espoliação em processos judiciais. Causada por limiares de confiança baixos ou seleção de entidades muito ampla. Ajustável pelos controles de limiar e entidades do anonym.legal.

#overredaction

Redação Insuficiente

Redação Insuficiente (Falsos Negativos)

Jurídico & Auditoria

Falha em remover toda a PII, expondo indivíduos em documentos compartilhados. O risco de conformidade mais comum. Causada por limiares de confiança altos, ausência de tipos de entidades ou formatos de PII inéditos. Mitigada pelo sistema híbrido de detecção e suporte a entidades personalizadas do anonym.legal.

#underredaction

Redaction

Redação de Dados

Privacidade de Dados & PII

Remoção ou ocultação permanente de informações sensíveis em documentos, substituindo-as por um marcador visual como [REDACTED] ou uma tarja preta. Diferente da criptografia, a redação é unidirecional e os dados originais não podem ser recuperados.

#redaction

Redator de Imagens

Serviço Presidio Image Redactor

Infraestrutura

Um serviço backend especializado (porta 8013) que detecta e redige PII em arquivos de imagem (PNG, JPEG) usando OCR e análise Presidio. Aplica tarjas pretas sobre as regiões de PII detectadas na imagem original.

#presidioimageredactor

Regex

Correspondência de Padrões com Expressões Regulares

Tecnologia de Detecção

Correspondência de texto baseada em padrões usando sintaxe de linguagem formal. Na detecção de PII, regex lida com identificadores estruturalmente previsíveis (números de telefone, cartões de crédito, IBANs, endereços de e-mail) com validação de dígito de controle. Complementa o NER para detecção híbrida.

#regex

Residência de Dados na UE

Residência de Dados na União Europeia

Infraestrutura

A garantia de que os dados são armazenados e processados exclusivamente dentro do território da UE/EEE. Os servidores de produção do anonym.legal estão na Alemanha (Hetzner Frankfurt), garantindo que todo o processamento ocorra sob jurisdição da GDPR, sem implicações de transferência internacional de dados.

#eudataresidency

REST API

API RESTful

Infraestrutura

anonym.legal expõe uma API HTTP RESTful para integração programática. Endpoints incluem /api/analyze, /api/anonymize, /api/image e /api/structured. Autenticada via tokens JWT bearer. Documentação OpenAPI completa disponível na Referência da API.

#restapi

Rule 26

Federal Rules of Civil Procedure Rule 26

Jurídico & Auditoria

Regra do processo civil dos EUA que rege as obrigações de discovery. Rule 26(g) exige que advogados certifiquem que solicitações e divulgações de discovery não são feitas para fins impróprios — incluindo a falha em redigir corretamente PII em documentos produzidos.

#rule26

S

SCCs

Cláusulas Contratuais Padrão

Conformidade & Regulamentações

Cláusulas contratuais pré-aprovadas e compatíveis com o GDPR para transferir dados pessoais da UE/EEE para países terceiros. Atualizadas pela Comissão Europeia em 2021 (2021/914/EU) para atender aos requisitos do Schrems II, incluindo uma Avaliação de Impacto da Transferência.

#sccs

Schrems II

Decisão Schrems II (C-311/18)

Conformidade & Regulamentações

Decisão de 2020 do Tribunal de Justiça da UE que invalidou o Privacy Shield UE-EUA para transferências transatlânticas de dados, citando proteção insuficiente das leis de vigilância dos EUA. Exige medidas suplementares (criptografia, anonimização) ao usar Cláusulas Contratuais Padrão.

#schremsii

SHA-256

Algoritmo de Hash Seguro 256-bit

Criptografia & Segurança

Uma função de hash criptográfico que produz um resumo de 256 bits. Utilizada na anonym.legal para autenticação HMAC de requisições API, provas de ZK auth e pseudonimização consistente de entidades (hash com salt gera o mesmo substituto para o mesmo valor original).

#sha256

Sigilo Advogado-Cliente

Proteção de Sigilo Advogado-Cliente

Jurídico & Auditoria

Proteção legal para comunicações confidenciais entre advogados e clientes. Em revisões documentais e e-discovery, conteúdos privilegiados devem ser identificados e retidos ou redigidos. Tipos de entidades personalizados no anonym.legal podem ser configurados para sinalizar marcadores de conteúdo privilegiado.

#attorneyclientprivilege

spaCy

Biblioteca NLP spaCy

Tecnologia de Detecção

Biblioteca NLP open-source de nível industrial em Python. O anonym.legal utiliza modelos baseados em transformadores do spaCy para 24 idiomas (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko, entre outros) para reconhecimento de entidades nomeadas na pipeline do Presidio.

#spacy

Stanza

Biblioteca NLP Stanza (Stanford NLP)

Tecnologia de Detecção

Toolkit NLP em Python do Stanford NLP Group, com suporte a mais de 70 idiomas e modelos neurais de última geração. Utilizado como backend NER suplementar no anonym.legal para idiomas não cobertos pelos modelos do spaCy.

#stanza

T

Tipo de Entidade

Tipo de Entidade PII

Tipos de Entidade

Uma categoria de informação pessoal que o mecanismo de detecção reconhece e pode anonimizar. Exemplos: PERSON, EMAIL_ADDRESS, PHONE_NUMBER, CREDIT_CARD, IBAN_CODE, US_SSN, IP_ADDRESS. anonym.legal suporta mais de 285 tipos de entidades em 48 idiomas.

#entitytype

TLS

Transport Layer Security

Criptografia & Segurança

O protocolo criptográfico que protege dados em trânsito. A anonym.legal exige TLS 1.2 como mínimo, com preferência para TLS 1.3, HSTS com max-age de um ano e HTTP/2. Todo o tráfego entre clientes e o servidor é criptografado durante o trânsito.

#tls

Token System

Sistema de Créditos anonym.legal

Plataforma & Produtos

Cobrança baseada em uso, onde chamadas à API consomem tokens calculados a partir do tamanho do texto, quantidade de entidades e modo de processamento (analisar vs. anonimizar). Os custos de tokens são configuráveis no banco de dados e exibidos em tempo real antes do processamento.

#tokensystem

Tokenization

Tokenização de Dados

Privacidade de Dados & PII

Substituição de dados sensíveis por um marcador não sensível (token) que pode ser mapeado ao original em um cofre seguro. Diferente da criptografia, o token em si não possui relação matemática com os dados originais.

#tokenization

Trilha de Auditoria

Trilha de Auditoria Imutável

Jurídico & Auditoria

Um registro sequencial e à prova de adulteração que documenta quem acessou, modificou ou processou dados e quando. Exigido pela ISO 27001 (A.8.15), HIPAA Security Rule (§164.312(b)) e regras de e-discovery. anonym.legal registra todas as operações de anonimização com carimbos de data/hora, contagem de entidades e IDs de operadores.

#audittrail

V

Vault

Cofre de Chaves de Criptografia

Plataforma & Produtos

Armazenamento local seguro para chaves de criptografia no Desktop App, protegido por derivação de chave Argon2id a partir de uma senha mestra. As chaves são armazenadas criptografadas usando AES-256-GCM e podem ser recuperadas via frases mnemônicas BIP39.

#vault

W

Web App

Aplicação Web anonym.legal

Plataforma & Produtos

Interface baseada em navegador no anonym.legal para análise, anonimização e descriptografia de PII. Suporta entrada de texto, upload de arquivos (PDF, DOCX, TXT), processamento em lote, ZK Auth, 48 idiomas e mais de 285 tipos de entidades. Não requer instalação.

#webapp

X

XChaCha20

XChaCha20-Poly1305

Criptografia & Segurança

Um algoritmo de criptografia autenticada que oferece alto desempenho em sistemas sem aceleração de hardware AES. Utiliza um nonce de 192 bits (estendido do nonce de 96 bits do padrão IETF ChaCha20 conforme RFC 8439), eliminando riscos de colisão de nonce. Usado como cifra alternativa na camada de criptografia da anonym.legal.

#xchacha20

XLM-RoBERTa

RoBERTa Multilíngue

Tecnologia de Detecção

Um modelo de linguagem transformador multilíngue treinado em 100 idiomas, desenvolvido pela Meta AI. Utilizado no anonym.legal para tarefas de NER multilíngue, especialmente para tipos de entidades e idiomas onde modelos monolíngues não estão disponíveis.

#xlmroberta

Z

Zero-Knowledge

Arquitetura Zero-Knowledge

Criptografia & Segurança

Um modelo de sistema em que o provedor de serviço não tem nenhum acesso aos dados em texto claro dos usuários nem às chaves de criptografia. Toda a criptografia e descriptografia ocorre no lado do cliente; o servidor nunca vê o conteúdo original. Previne ameaças internas e divulgação forçada.

#zeroknowledge

ZK Auth

Autenticação Zero-Knowledge

Criptografia & Segurança

Sistema de autenticação da anonym.legal onde as chaves de criptografia são derivadas no lado do cliente a partir da frase secreta do usuário utilizando Argon2id, nunca sendo transmitidas ou armazenadas no servidor. O servidor armazena apenas uma prova criptográfica, não a chave ou a frase secreta.

#zkauth