94 术语
2FA
双因素认证
需要两个不同验证因素的认证:用户知道的东西(密码)和用户拥有的东西(TOTP 应用程序、硬件密钥)或是(生物识别)。在 anonym.legal 中作为 ZK Auth 之上的附加层得到支持。
#twofa保险标识符
保险实体类型
与保险相关的标识符的实体类型:US_NPI(医疗保健提供者的国家提供者标识符)、HEALTHCARE_PLAN_BENEFICIARY 和国家特定的健康保险号码(例如,DE_HEALTH_INSURANCE_NUMBER)。
#insuranceidentifiers不足编辑
不足编辑(假阴性)
未能删除所有 PII,使个人在共享文档中暴露。更常见的合规风险。由高置信阈值、缺失的实体类型或新颖的 PII 格式引起。通过 anonym.legal 的混合检测和自定义实体支持来缓解。
#underredaction操作符
匿名化操作符
应用于检测到的 PII 的替换策略。anonym.legal 支持 REPLACE(占位符文本)、REDACT(空字符串)、MASK(星号)、HASH(SHA-256 摘要)、ENCRYPT(可逆 AES-256-GCM)和 CUSTOM(用户定义替换)。
#operators差分隐私
差分隐私 (DP)
一种数学框架,用于发布关于数据集的统计信息,同时提供可证明的保证,确保任何个人的数据无法被区分。用于汇总分析,以防止在查询汇总输出时重新识别。
#differentialprivacy车辆标识符
车辆实体类型
与车辆相关的标识符的实体类型:US_DRIVER_LICENSE、UK_DRIVER_LICENSE、EU_DRIVER_LICENSE、VIN(车辆识别号码)和国家特定的车辆注册牌格式。
#vehicleidentifiers代码切换
多语言代码切换
在单一文本或对话中混合两种或更多语言的现象。常见于多语言文档(例如,带有英语技术术语的德语法律文件)。anonym.legal 的混合检测通过同时应用多种语言模型来处理代码切换文本。
#codeswitching过度编辑
过度编辑(假阳性)
删除超过必要的信息,降低文档的实用性,并可能在法律程序中构成证据毁灭。由低置信阈值或过于宽泛的实体选择引起。可以通过 anonym.legal 的阈值和实体控制进行调节。
#overredaction哈希
密码哈希
使用 SHA-256 等算法将数据进行单向转换为固定长度的摘要。用于一致的伪匿名化、去重和完整性验证。哈希值无法逆转,但如果没有加盐,可能会受到彩虹表攻击的威胁。
#hashing混合检测
混合 NLP + 正则表达式 + 机器学习检测
anonym.legal 的三层方法:用于结构化 PII(电话号码、IBAN、信用卡)的正则表达式模式、用于上下文实体(姓名、组织、地点)的 NLP/NER 模型,以及用于模糊案例的机器学习分类器。减少假阳性和假阴性。
#hybriddetection金融实体
金融 PII 实体类型
涵盖金融标识符的实体类型:CREDIT_CARD(Luhn 校验和)、IBAN_CODE(ISO 13616 校验和)、SWIFT_CODE(BIC 格式)、US_BANK_NUMBER、NRP(西班牙税号)。通过校验和验证进行检测,以最小化假阳性。
#financialentities可辩护性
法律可辩护的匿名化
向监管机构、法院或审计员证明匿名化是使用文档化、一致和技术上合理的方法执行的能力。anonym.legal 的审计日志、置信分数和操作员设置支持可辩护的匿名化工作流程。
#defensibility令牌系统
anonym.legal 信用令牌系统
基于使用的计费,API 调用消耗根据文本长度、实体数量和处理模式(分析与匿名化)计算的令牌。令牌成本在数据库中可配置,并在处理前实时显示。
#tokensystem律师-客户特权
律师-客户特权保护
律师与客户之间保密通信的法律保护。在文档审查和电子发现中,必须识别和保留或编辑特权内容。anonym.legal 中的自定义实体类型可以配置为标记特权内容标记。
#attorneyclientprivilege批处理
批量文件匿名化
在单个操作中同时处理多个文件。anonym.legal 的批处理模式支持 PDF、DOCX 和 TXT 文件,具有每个文件的实体配置、置信阈值和输出格式选择。
#batchprocessing审计轨迹
不可变审计轨迹
记录谁在何时访问、修改或处理数据的顺序、可篡改的日志。根据 ISO 27001(A.8.15)、HIPAA 安全规则 (§164.312(b)) 和电子发现规则要求。anonym.legal 记录所有匿名化操作,包括时间戳、实体计数和操作员 ID。
#audittrail实体类型
PII 实体类型
检测引擎识别并可以匿名化的个人信息类别。示例:PERSON、EMAIL_ADDRESS、PHONE_NUMBER、CREDIT_CARD、IBAN_CODE、US_SSN、IP_ADDRESS。anonym.legal 支持 285 种以上的实体类型,覆盖 48 种语言。
#entitytype数据驻留
数据驻留要求
法律或合同要求,指定数据必须存储和处理的地理位置。与 GDPR(数据转移到 EEA 之外)、德国 BDSG 和医疗保健及金融领域的特定法规相关。
#dataresidency数据最小化
GDPR 数据最小化原则
GDPR 第 5(1)(c) 条原则要求仅收集和处理为特定目的所需的适当、相关和必要的数据。隐私合规系统的核心设计约束。
#dataminimization数字标识符
数字身份实体类型
在线和数字标识符的实体类型:EMAIL_ADDRESS、PHONE_NUMBER、IP_ADDRESS(IPv4 和 IPv6)、URL、DOMAIN_NAME、CRYPTO(比特币/以太坊地址)和特定平台标识符。
#digitalidentifiers速率限制
API 速率限制
控制客户端在时间窗口内可以发出的 API 请求数量。防止滥用并确保公平的资源分配。anonym.legal 根据计划等级应用每用户速率限制,建议使用指数退避进行重试逻辑。
#ratelimiting通用实体
语言通用实体类型
无论文本语言如何检测的实体类型,通常通过基于格式的正则表达式和校验和验证进行检测。示例:CREDIT_CARD、IBAN_CODE、EMAIL_ADDRESS、PHONE_NUMBER、IP_ADDRESS、URL、CRYPTO 地址。
#universalentities图像编辑器
Presidio 图像编辑器服务
一种专门的后端服务(端口 8013),使用 OCR 和 Presidio 分析从图像文件(PNG、JPEG)中检测和编辑 PII。在原始图像中检测到的 PII 区域上应用黑条编辑。
#presidioimageredactor伪匿名化
数据伪匿名化
用人工值(伪名)替换直接标识符,同时保留使用单独密钥重新识别个人的能力。GDPR 第 4(5) 条将其视为一种增强隐私的技术,但不将伪匿名化数据排除在法规之外。
#pseudonymization医疗保健实体
医疗保健 PII 实体类型
18 个 HIPAA 安全港标识符和其他健康相关 PII 的实体类型:US_MRN(医疗记录号码)、MEDICAL_LICENSE、HEALTHCARE_PLAN_BENEFICIARY 和诊断/治疗上下文实体。
#healthcareentities隐私设计
隐私设计与默认
GDPR 第 25 条规定的原则,要求数据保护措施在系统设计之初就内置,而不是事后添加。涵盖数据最小化、访问控制、加密和架构级别的伪匿名化。
#privacybydesign语言检测
自动语言检测
在 PII 分析之前自动识别输入文本的语言。anonym.legal 在请求级别检测语言,并将其路由到适当的 NER 模型管道,对于不支持的语言使用英语作为后备。
#languagedetection政府 ID
政府标识符实体类型
国家和政府签发标识符的实体类型:US_SSN、US_PASSPORT、UK_NHS、ES_NIF、DE_PERSONALAUSWEIS、FR_INSEE、IT_FISCAL_CODE 和 50 多种其他国家特定 ID 格式。使用国家特定的正则表达式 + 校验和模式进行检测。
#governmentid置信评分
实体检测置信分数
一个 0–1 的分数,表示检测模型对文本片段是 PII 实体的确定程度。anonym.legal 提供可配置的置信阈值,以便用户可以调整特定用例的精确度与召回率的权衡。
#confidencescoring桌面应用
anonym.legal 桌面应用程序
跨平台应用程序(Windows、macOS、Linux),使用 Tauri 2.0 和 React 18 构建。具有本地文件处理、BIP39 保险库用于离线 ZK Auth、批量导出和 API 同步。支持无互联网访问的隔离部署。
#desktopapp自定义实体
自定义实体识别器
用户定义的 PII 模式,添加到 anonym.legal 内置的 285 种以上实体类型之上。支持正则表达式模式、单词列表和拒绝列表。适用于组织特定的标识符,如员工 ID、内部项目代码或专有产品名称。
#customentitiesAES-256-GCM
高级加密标准 256 位 Galois/计数模式
一种认证加密算法,将 AES-256(256 位密钥)与 Galois/计数模式结合,以确保机密性和完整性。用于 anonym.legal 的可逆匿名化,以加密替换的实体。提供机密性和篡改检测。
#aes256gcmArgon2id
Argon2id 密钥派生函数
2015 年密码哈希竞赛的获胜者。Argon2id 结合了 Argon2i 的侧信道抗性和 Argon2d 的 GPU 抗性。用于 anonym.legal 和桌面应用程序保险库,从用户密码短语派生加密密钥。
#argon2idBIP39
比特币改进提案 39 — 助记短语
从加密种子生成可读的助记种子短语(12–24 个单词)的标准。用于 anonym.legal 桌面应用程序保险库,作为用户友好的 Argon2id 派生加密密钥的备份。
#bip39Chrome 扩展
anonym.legal Chrome 扩展
浏览器扩展(Manifest V3),在文本发送到 AI 聊天机器人(ChatGPT、Claude、Gemini、Perplexity、DeepSeek)之前拦截文本。即时匿名化,并可选择使用保存的加密密钥解密 AI 响应。
#chromeextensionCLOUD Act
澄清合法海外数据使用法案
允许美国执法部门强制美国云服务提供商提供存储在国外的数据的美国联邦法律(2018 年)。与 GDPR 数据转移规则相冲突。上传到云之前对数据进行匿名化是常见的缓解措施。
#cloudactCSP
内容安全策略
一种 HTTP 响应头和元标签机制,限制浏览器可以加载哪些资源(脚本、样式、图像)。anonym.legal 的 CSP 包括 object-src 'none'、带有随机数的 script-src 和 upgrade-insecure-requests,以防止 XSS 攻击。
#cspDDoS 保护
分布式拒绝服务保护
针对分布式拒绝服务攻击的基础设施级防御。anonym.legal 的服务器基础设施包括防火墙规则(UFW)、nginx 连接限制和 Cloudflare 等效的上游保护,以保持可用性。
#ddosprotectionE2EE
端到端加密
只有通信方可以读取消息的加密;服务提供商无法访问明文。在 anonym.legal 的 ZK Auth 模式中,加密密钥永远不会离开客户端设备,实现了对匿名输出存储的 E2EE。
#e2eeEU 数据驻留
欧盟数据驻留
保证数据仅在 EU/EEA 领土内存储和处理。anonym.legal 的生产服务器位于德国(Hetzner 法兰克福),确保所有处理在 GDPR 管辖范围内进行,而不涉及跨境数据转移的影响。
#eudataresidencyGDPR
通用数据保护条例
欧盟法规 2016/679,欧盟的主要数据保护框架。适用于处理欧盟居民个人数据的任何组织。最高可罚款 2000 万欧元或全球年收入的 4%。关键权利:访问、删除、可携带性、限制、反对。
#gdprGDPR 第 32 条
GDPR 第 32 条 — 处理的安全性
要求控制者和处理者实施适当的技术和组织措施,以确保风险适当的安全级别,包括加密、伪匿名化、机密性、完整性、可用性和处理系统的弹性。
#gdprarticle32GenAI DLP
生成式 AI 数据丢失防护
一种专注于防止 PII 和机密数据被包含在发送给生成式 AI 模型(ChatGPT、Claude、Gemini)的提示中的 DLP 专门类别。anonym.legal 的 Chrome 扩展和 MCP 服务器在输入点解决此风险。
#genaidlpHetzner
Hetzner Online GmbH
anonym.legal 的生产基础设施运行的德国云和托管提供商。位于法兰克福(fsn1)数据中心,获得 ISO 27001 认证。因其符合欧盟数据驻留、合规态度和根据德国法律的 GDPR 友好管辖权而被选择。
#hetznerHIPAA
健康保险流通与问责法案
美国联邦法律,建立保护敏感患者健康信息的标准。隐私规则管理 PHI 的使用;安全规则要求对电子 PHI (ePHI) 进行行政、物理和技术保护。违规可导致每类每年最高 190 万美元的罚款。
#hipaaHIPAA 安全港
HIPAA 安全港去标识化方法
两种 HIPAA 批准的去标识化方法之一,要求删除所有 18 个指定的患者标识符(姓名、地址、日期、电话号码、社保号、电子邮件、IP 地址、生物识别等),以使健康数据不再可单独识别。
#hipaasafeharborHSTS
HTTP 严格传输安全性
一种网络安全政策机制,强制浏览器仅使用 HTTPS 连接。anonym.legal 设置 Strict-Transport-Security: max-age=31536000; includeSubDomains,以防止协议降级攻击和 cookie 劫持。
#hstsISO 27001
ISO/IEC 27001 信息安全管理
信息安全管理系统 (ISMS) 的国际标准。认证要求有文档政策、风险评估和控制。anonym.legal 的欧盟服务器经过 ISO 27001 认证,确保结构化的安全治理。
#iso27001ISO 27001 SoA
适用性声明
一份强制性的 ISO 27001 文件,列出所有附录 A 控制措施,指明哪些适用于组织,并提供包含和排除的理由。认证和审计所必需。
#iso27001soaJWT
JSON Web 令牌
一种紧凑的、URL 安全的令牌格式,用于在各方之间传输声明。anonym.legal 使用使用 HS256 签名的 JWT 进行内部服务到服务的认证(例如,前端 → Presidio API)。令牌是短期有效的,并在服务器端进行验证。
#jwtKEK
密钥加密密钥
用于加密其他密钥而不是直接加密数据的密钥。在 anonym.legal 的 ZK 架构中,用户密码短语派生的密钥充当 KEK,以保护存储在加密保险库中的每个文档加密密钥。
#kekMCP
模型上下文协议
由 Anthropic 提出的开放协议,使 AI 模型能够以标准化方式与外部工具和数据源进行交互。anonym.legal 实现了 MCP 服务器,以便 AI 编码工具可以在不离开其工作流程的情况下调用匿名化。
#mcpMCP 服务器
模型上下文协议服务器
anonym.legal 的 MCP 服务器集成使 AI 编码助手(Claude Desktop、Cursor、VS Code Copilot)能够直接调用匿名化 API 作为工具。PII 在发送到 AI 模型之前从代码、提示和上下文中剥离。
#mcpserverML 模型
用于 PII 检测的机器学习模型
在标记文本语料库上训练的统计模型,以识别上下文中的 PII。anonym.legal 使用 spaCy 转换器管道和微调的 XLM-RoBERTa 进行生产规模的多语言实体识别。
#mlmodelsOffice 插件
anonym.legal Microsoft Office 插件
将 PII 匿名化直接集成到 Word、Excel 和 PowerPoint 中的 Microsoft Office 扩展。支持文档内编辑、预设管理、ZK Auth 和跨设备同步。可从 Microsoft AppSource 获取。
#officeaddinPCI DSS
支付卡行业数据安全标准
处理支付卡数据的组织的安全标准,由 PCI 安全标准委员会维护。要求加密、访问控制、日志记录和定期测试。不合规可能导致罚款和失去卡处理权限。
#pcidssPresidio
微软 Presidio
微软的开源数据保护和匿名化 SDK。anonym.legal 的检测引擎建立在 Presidio 的分析器和匿名化服务之上,扩展了 285 多个自定义实体识别器,覆盖 48 种语言。
#presidioPresidio 分析器
微软 Presidio 分析器服务
anonym.legal 后端的检测组件(端口 8011)。接受文本并返回检测到的 PII 实体及其位置、类型和置信分数的列表。扩展了 285 多个自定义识别器,覆盖 48 种语言。
#presidioanalyzerPresidio 匿名化器
微软 Presidio 匿名化器服务
anonym.legal 后端的转换组件(端口 8012)。接受文本和分析结果作为输入,对每个检测到的实体应用所选操作符(REPLACE、REDACT、MASK、HASH、ENCRYPT),并返回匿名化文本。
#presidioanonymizerSCCs
标准合同条款
将个人数据从 EU/EEA 转移到第三国的预先批准的 GDPR 合规合同条款。2021 年由欧盟委员会更新(2021/914/EU),以满足 Schrems II 要求,包括转移影响评估。
#sccsSchrems II
Schrems II 裁决 (C-311/18)
2020 年欧盟法院裁决无效欧盟-美国隐私保护框架,理由是美国监视法律保护不足。使用标准合同条款时,要求采取补充措施(加密、匿名化)。
#schremsiiSHA-256
安全哈希算法 256 位
一种生成 256 位摘要的密码哈希函数。用于 anonym.legal 的 API 请求 HMAC 认证、ZK 认证证明和一致的实体伪匿名化(加盐哈希为相同原始值生成相同替换)。
#sha256spaCy
spaCy NLP 库
工业级开源 NLP 库,使用 Python 编写。anonym.legal 使用 spaCy 的基于转换器的模型支持 24 种语言(en、de、fr、es、it、pt、nl、pl、ru、zh、ja、ko 等)进行命名实体识别。
#spacyStanza
Stanza NLP 库 (斯坦福 NLP)
斯坦福 NLP 小组的 Python NLP 工具包,支持 70 多种语言,具有最先进的神经模型。作为 anonym.legal 中的补充 NER 后端,用于 spaCy 模型未覆盖的语言。
#stanzaTLS
传输层安全性
保护数据在传输中安全的加密协议。anonym.legal 强制执行 TLS 1.2 最低标准,优先使用 TLS 1.3,HSTS 最大年龄为一年,并使用 HTTP/2。客户端与服务器之间的所有流量在传输中均被加密。
#tlsWeb 应用
anonym.legal 网络应用程序
anonym.legal 的基于浏览器的界面,用于 PII 分析、匿名化和解密。支持文本输入、文件上传(PDF、DOCX、TXT)、批处理、ZK Auth、48 种语言和 285 种以上的实体类型。无需安装。
#webappXChaCha20
XChaCha20-Poly1305
一种认证加密算法,在没有 AES 硬件加速的系统上提供高性能。使用 192 位随机数(从 ChaCha20 的 64 位扩展),消除随机数冲突风险。作为 anonym.legal 加密层中的替代密码使用。
#xchacha20XLM-RoBERTa
跨语言 RoBERTa
一种在 100 种语言上训练的多语言转换器语言模型,由 Meta AI 开发。用于 anonym.legal 中的跨语言 NER 任务,特别是对于单语言模型不可用的实体类型和语言。
#xlmrobertaZK Auth
零知识认证
anonym.legal 的认证系统,其中加密密钥是通过客户端从用户的密码短语使用 Argon2id 派生的,绝不传输到服务器或存储在服务器上。服务器仅存储加密证明,而不是密钥或密码短语。
#zkauth