Docs/Glossary

隐私与技术术语表

PII 匿名化和数据隐私中使用的所有术语、缩略语和概念的定义。

返回文档

94 术语

2

2FA

双因素认证

加密与安全

需要两个不同验证因素的认证:用户知道的东西(密码)和用户拥有的东西(TOTP 应用程序、硬件密钥)或是(生物识别)。在 anonym.legal 中作为 ZK Auth 之上的附加层得到支持。

#twofa

保险标识符

保险实体类型

实体类型

与保险相关的标识符的实体类型:US_NPI(医疗保健提供者的国家提供者标识符)、HEALTHCARE_PLAN_BENEFICIARY 和国家特定的健康保险号码(例如,DE_HEALTH_INSURANCE_NUMBER)。

#insuranceidentifiers

保险库

加密密钥保险库

平台与产品

桌面应用中加密密钥的安全本地存储,由 Argon2id 密钥派生自主密码保护。密钥使用 AES-256-GCM 加密存储,并通过 BIP39 助记短语备份。

#vault

编辑

数据编辑

数据隐私与 PII

永久性地从文档中删除或模糊敏感信息,用视觉标记(如 [REDACTED] 或黑条)替换。与加密不同,编辑是单向的,原始数据无法恢复。

#redaction

不足编辑

不足编辑(假阴性)

法律与审计

未能删除所有 PII,使个人在共享文档中暴露。更常见的合规风险。由高置信阈值、缺失的实体类型或新颖的 PII 格式引起。通过 anonym.legal 的混合检测和自定义实体支持来缓解。

#underredaction

操作符

匿名化操作符

平台与产品

应用于检测到的 PII 的替换策略。anonym.legal 支持 REPLACE(占位符文本)、REDACT(空字符串)、MASK(星号)、HASH(SHA-256 摘要)、ENCRYPT(可逆 AES-256-GCM)和 CUSTOM(用户定义替换)。

#operators

差分隐私

差分隐私 (DP)

数据隐私与 PII

一种数学框架,用于发布关于数据集的统计信息,同时提供可证明的保证,确保任何个人的数据无法被区分。用于汇总分析,以防止在查询汇总输出时重新识别。

#differentialprivacy

车辆标识符

车辆实体类型

实体类型

与车辆相关的标识符的实体类型:US_DRIVER_LICENSE、UK_DRIVER_LICENSE、EU_DRIVER_LICENSE、VIN(车辆识别号码)和国家特定的车辆注册牌格式。

#vehicleidentifiers

代码切换

多语言代码切换

检测技术

在单一文本或对话中混合两种或更多语言的现象。常见于多语言文档(例如,带有英语技术术语的德语法律文件)。anonym.legal 的混合检测通过同时应用多种语言模型来处理代码切换文本。

#codeswitching

电子发现

电子发现

法律与审计

在法律程序中识别、收集和生成电子存储信息的过程。要求从生成的文档中编辑 PII 和特权信息。使用 anonym.legal 的法律部门的主要用例。

#ediscovery

规则 26

联邦民事诉讼规则第 26 条

法律与审计

管理发现义务的美国民事诉讼规则。规则 26(g) 要求律师证明发现请求和披露不是出于不当目的——包括未能正确编辑生成的文档中的 PII。

#rule26

过度编辑

过度编辑(假阳性)

法律与审计

删除超过必要的信息,降低文档的实用性,并可能在法律程序中构成证据毁灭。由低置信阈值或过于宽泛的实体选择引起。可以通过 anonym.legal 的阈值和实体控制进行调节。

#overredaction

哈希

密码哈希

数据隐私与 PII

使用 SHA-256 等算法将数据进行单向转换为固定长度的摘要。用于一致的伪匿名化、去重和完整性验证。哈希值无法逆转,但如果没有加盐,可能会受到彩虹表攻击的威胁。

#hashing

混合检测

混合 NLP + 正则表达式 + 机器学习检测

检测技术

anonym.legal 的三层方法:用于结构化 PII(电话号码、IBAN、信用卡)的正则表达式模式、用于上下文实体(姓名、组织、地点)的 NLP/NER 模型,以及用于模糊案例的机器学习分类器。减少假阳性和假阴性。

#hybriddetection

金融实体

金融 PII 实体类型

实体类型

涵盖金融标识符的实体类型:CREDIT_CARD(Luhn 校验和)、IBAN_CODE(ISO 13616 校验和)、SWIFT_CODE(BIC 格式)、US_BANK_NUMBER、NRP(西班牙税号)。通过校验和验证进行检测,以最小化假阳性。

#financialentities

可辩护性

法律可辩护的匿名化

法律与审计

向监管机构、法院或审计员证明匿名化是使用文档化、一致和技术上合理的方法执行的能力。anonym.legal 的审计日志、置信分数和操作员设置支持可辩护的匿名化工作流程。

#defensibility

零知识

零知识架构

加密与安全

一种系统设计,其中服务提供商无法访问用户的明文数据或加密密钥。所有加密/解密都在客户端进行;服务器从不看到原始内容。防止内部威胁和强制披露。

#zeroknowledge

令牌化

数据令牌化

数据隐私与 PII

用非敏感占位符(令牌)替换敏感数据,该令牌可以安全地映射回原始数据。与加密不同,令牌本身与原始数据没有数学关系。

#tokenization

令牌系统

anonym.legal 信用令牌系统

平台与产品

基于使用的计费,API 调用消耗根据文本长度、实体数量和处理模式(分析与匿名化)计算的令牌。令牌成本在数据库中可配置,并在处理前实时显示。

#tokensystem

律师-客户特权

律师-客户特权保护

法律与审计

律师与客户之间保密通信的法律保护。在文档审查和电子发现中,必须识别和保留或编辑特权内容。anonym.legal 中的自定义实体类型可以配置为标记特权内容标记。

#attorneyclientprivilege

匿名化

数据匿名化

数据隐私与 PII

不可逆的过程,通过删除或转换识别信息,使个人无法再被直接或间接识别。在 GDPR 下,真正匿名化的数据不受该法规的约束。

#anonymization

批处理

批量文件匿名化

平台与产品

在单个操作中同时处理多个文件。anonym.legal 的批处理模式支持 PDF、DOCX 和 TXT 文件,具有每个文件的实体配置、置信阈值和输出格式选择。

#batchprocessing

去匿名化

重新识别攻击

数据隐私与 PII

通过与辅助信息交叉引用,从所谓的匿名数据集中重新识别个人的过程。在数据共享时,缺乏足够的匿名化深度是一个关键风险。

#deanonymization

审计轨迹

不可变审计轨迹

法律与审计

记录谁在何时访问、修改或处理数据的顺序、可篡改的日志。根据 ISO 27001(A.8.15)、HIPAA 安全规则 (§164.312(b)) 和电子发现规则要求。anonym.legal 记录所有匿名化操作,包括时间戳、实体计数和操作员 ID。

#audittrail

实体类型

PII 实体类型

实体类型

检测引擎识别并可以匿名化的个人信息类别。示例:PERSON、EMAIL_ADDRESS、PHONE_NUMBER、CREDIT_CARD、IBAN_CODE、US_SSN、IP_ADDRESS。anonym.legal 支持 285 种以上的实体类型,覆盖 48 种语言。

#entitytype

数据主权

数字数据主权

合规与法规

数据受其收集国家的法律和治理结构的原则。比数据驻留更广泛,涵盖对谁可以访问数据以及在何种法律框架下访问的控制。

#datasovereignty

数据驻留

数据驻留要求

合规与法规

法律或合同要求,指定数据必须存储和处理的地理位置。与 GDPR(数据转移到 EEA 之外)、德国 BDSG 和医疗保健及金融领域的特定法规相关。

#dataresidency

数据最小化

GDPR 数据最小化原则

数据隐私与 PII

GDPR 第 5(1)(c) 条原则要求仅收集和处理为特定目的所需的适当、相关和必要的数据。隐私合规系统的核心设计约束。

#dataminimization

数字标识符

数字身份实体类型

实体类型

在线和数字标识符的实体类型:EMAIL_ADDRESS、PHONE_NUMBER、IP_ADDRESS(IPv4 和 IPv6)、URL、DOMAIN_NAME、CRYPTO(比特币/以太坊地址)和特定平台标识符。

#digitalidentifiers

速率限制

API 速率限制

基础设施

控制客户端在时间窗口内可以发出的 API 请求数量。防止滥用并确保公平的资源分配。anonym.legal 根据计划等级应用每用户速率限制,建议使用指数退避进行重试逻辑。

#ratelimiting

通用实体

语言通用实体类型

实体类型

无论文本语言如何检测的实体类型,通常通过基于格式的正则表达式和校验和验证进行检测。示例:CREDIT_CARD、IBAN_CODE、EMAIL_ADDRESS、PHONE_NUMBER、IP_ADDRESS、URL、CRYPTO 地址。

#universalentities

图像编辑器

Presidio 图像编辑器服务

基础设施

一种专门的后端服务(端口 8013),使用 OCR 和 Presidio 分析从图像文件(PNG、JPEG)中检测和编辑 PII。在原始图像中检测到的 PII 区域上应用黑条编辑。

#presidioimageredactor

伪匿名化

数据伪匿名化

数据隐私与 PII

用人工值(伪名)替换直接标识符,同时保留使用单独密钥重新识别个人的能力。GDPR 第 4(5) 条将其视为一种增强隐私的技术,但不将伪匿名化数据排除在法规之外。

#pseudonymization

掩码

数据掩码

数据隐私与 PII

用现实但虚构的数据替换敏感值,以保留格式和结构。用于测试环境、分析和共享数据集,而不暴露真实的 PII。

#masking

医疗保健实体

医疗保健 PII 实体类型

实体类型

18 个 HIPAA 安全港标识符和其他健康相关 PII 的实体类型:US_MRN(医疗记录号码)、MEDICAL_LICENSE、HEALTHCARE_PLAN_BENEFICIARY 和诊断/治疗上下文实体。

#healthcareentities

隐私设计

隐私设计与默认

数据隐私与 PII

GDPR 第 25 条规定的原则,要求数据保护措施在系统设计之初就内置,而不是事后添加。涵盖数据最小化、访问控制、加密和架构级别的伪匿名化。

#privacybydesign

语言检测

自动语言检测

检测技术

在 PII 分析之前自动识别输入文本的语言。anonym.legal 在请求级别检测语言,并将其路由到适当的 NER 模型管道,对于不支持的语言使用英语作为后备。

#languagedetection

预设

匿名化预设

平台与产品

已保存的选定实体类型、置信阈值和输出选项的配置,可以一键应用。预设通过加密云存储在 Web 应用、Office 插件和桌面应用之间同步。

#presets

证据毁灭

证据毁灭

法律与审计

销毁、改变或未能保存与诉讼相关的证据。过于激进的编辑使文档无法阅读可能构成证据毁灭。校准匿名化精度(置信阈值、实体选择)对法律上可辩护的编辑非常重要。

#spoliation

政府 ID

政府标识符实体类型

实体类型

国家和政府签发标识符的实体类型:US_SSN、US_PASSPORT、UK_NHS、ES_NIF、DE_PERSONALAUSWEIS、FR_INSEE、IT_FISCAL_CODE 和 50 多种其他国家特定 ID 格式。使用国家特定的正则表达式 + 校验和模式进行检测。

#governmentid

置信评分

实体检测置信分数

检测技术

一个 0–1 的分数,表示检测模型对文本片段是 PII 实体的确定程度。anonym.legal 提供可配置的置信阈值,以便用户可以调整特定用例的精确度与召回率的权衡。

#confidencescoring

桌面应用

anonym.legal 桌面应用程序

平台与产品

跨平台应用程序(Windows、macOS、Linux),使用 Tauri 2.0 和 React 18 构建。具有本地文件处理、BIP39 保险库用于离线 ZK Auth、批量导出和 API 同步。支持无互联网访问的隔离部署。

#desktopapp

自定义实体

自定义实体识别器

平台与产品

用户定义的 PII 模式,添加到 anonym.legal 内置的 285 种以上实体类型之上。支持正则表达式模式、单词列表和拒绝列表。适用于组织特定的标识符,如员工 ID、内部项目代码或专有产品名称。

#customentities
A

AES-256-GCM

高级加密标准 256 位 Galois/计数模式

加密与安全

一种认证加密算法,将 AES-256(256 位密钥)与 Galois/计数模式结合,以确保机密性和完整性。用于 anonym.legal 的可逆匿名化,以加密替换的实体。提供机密性和篡改检测。

#aes256gcm

Argon2id

Argon2id 密钥派生函数

加密与安全

2015 年密码哈希竞赛的获胜者。Argon2id 结合了 Argon2i 的侧信道抗性和 Argon2d 的 GPU 抗性。用于 anonym.legal 和桌面应用程序保险库,从用户密码短语派生加密密钥。

#argon2id
B

BIP39

比特币改进提案 39 — 助记短语

加密与安全

从加密种子生成可读的助记种子短语(12–24 个单词)的标准。用于 anonym.legal 桌面应用程序保险库,作为用户友好的 Argon2id 派生加密密钥的备份。

#bip39
C

CCPA

加利福尼亚消费者隐私法

合规与法规

加利福尼亚隐私法,赋予居民知情、删除和选择退出出售其个人信息的权利。适用于满足收入、数据量或数据销售阈值的企业。2023 年由 CPRA 修订。

#ccpa

Chrome 扩展

anonym.legal Chrome 扩展

平台与产品

浏览器扩展(Manifest V3),在文本发送到 AI 聊天机器人(ChatGPT、Claude、Gemini、Perplexity、DeepSeek)之前拦截文本。即时匿名化,并可选择使用保存的加密密钥解密 AI 响应。

#chromeextension

CLOUD Act

澄清合法海外数据使用法案

合规与法规

允许美国执法部门强制美国云服务提供商提供存储在国外的数据的美国联邦法律(2018 年)。与 GDPR 数据转移规则相冲突。上传到云之前对数据进行匿名化是常见的缓解措施。

#cloudact

CSP

内容安全策略

加密与安全

一种 HTTP 响应头和元标签机制,限制浏览器可以加载哪些资源(脚本、样式、图像)。anonym.legal 的 CSP 包括 object-src 'none'、带有随机数的 script-src 和 upgrade-insecure-requests,以防止 XSS 攻击。

#csp
D

DDoS 保护

分布式拒绝服务保护

基础设施

针对分布式拒绝服务攻击的基础设施级防御。anonym.legal 的服务器基础设施包括防火墙规则(UFW)、nginx 连接限制和 Cloudflare 等效的上游保护,以保持可用性。

#ddosprotection

DLP

数据丢失防护

平台与产品

一种安全学科和软件工具类别,检测和防止敏感数据未经授权传输到组织外部。anonym.legal 作为 PII 的浏览器层和 AI 层 DLP 解决方案。

#dlp

DPA

数据处理协议

合规与法规

数据控制者与数据处理者之间的法律约束合同,GDPR 第 28 条所要求。规定了主题、持续时间、性质、目的和个人数据处理类型,以及双方的权利和义务。

#dpa

DPIA

数据保护影响评估

合规与法规

GDPR 第 35 条要求的风险评估过程,适用于可能对个人权利和自由造成高风险的处理活动。对系统化的分析、大规模 PHI 处理和公共区域监控是强制性的。

#dpia
E

E2EE

端到端加密

加密与安全

只有通信方可以读取消息的加密;服务提供商无法访问明文。在 anonym.legal 的 ZK Auth 模式中,加密密钥永远不会离开客户端设备,实现了对匿名输出存储的 E2EE。

#e2ee

EU 数据驻留

欧盟数据驻留

基础设施

保证数据仅在 EU/EEA 领土内存储和处理。anonym.legal 的生产服务器位于德国(Hetzner 法兰克福),确保所有处理在 GDPR 管辖范围内进行,而不涉及跨境数据转移的影响。

#eudataresidency
F

FOIA

信息自由法

合规与法规

美国联邦法律(以及其他司法管辖区的等效法规),赋予公众访问政府记录的权利。要求在披露之前编辑 PII 和其他豁免信息——这是法律和政府匿名化工作流程的主要用例。

#foia
G

GDPR

通用数据保护条例

合规与法规

欧盟法规 2016/679,欧盟的主要数据保护框架。适用于处理欧盟居民个人数据的任何组织。最高可罚款 2000 万欧元或全球年收入的 4%。关键权利:访问、删除、可携带性、限制、反对。

#gdpr

GDPR 第 25 条

GDPR 第 25 条 — 设计和默认的保护数据

合规与法规

要求控制者在系统设计时和处理期间默认实施适当的技术和组织措施(如伪匿名化和数据最小化)。

#gdprarticle25

GDPR 第 32 条

GDPR 第 32 条 — 处理的安全性

合规与法规

要求控制者和处理者实施适当的技术和组织措施,以确保风险适当的安全级别,包括加密、伪匿名化、机密性、完整性、可用性和处理系统的弹性。

#gdprarticle32

GenAI DLP

生成式 AI 数据丢失防护

平台与产品

一种专注于防止 PII 和机密数据被包含在发送给生成式 AI 模型(ChatGPT、Claude、Gemini)的提示中的 DLP 专门类别。anonym.legal 的 Chrome 扩展和 MCP 服务器在输入点解决此风险。

#genaidlp
H

Hetzner

Hetzner Online GmbH

基础设施

anonym.legal 的生产基础设施运行的德国云和托管提供商。位于法兰克福(fsn1)数据中心,获得 ISO 27001 认证。因其符合欧盟数据驻留、合规态度和根据德国法律的 GDPR 友好管辖权而被选择。

#hetzner

HIPAA

健康保险流通与问责法案

合规与法规

美国联邦法律,建立保护敏感患者健康信息的标准。隐私规则管理 PHI 的使用;安全规则要求对电子 PHI (ePHI) 进行行政、物理和技术保护。违规可导致每类每年最高 190 万美元的罚款。

#hipaa

HIPAA 安全港

HIPAA 安全港去标识化方法

合规与法规

两种 HIPAA 批准的去标识化方法之一,要求删除所有 18 个指定的患者标识符(姓名、地址、日期、电话号码、社保号、电子邮件、IP 地址、生物识别等),以使健康数据不再可单独识别。

#hipaasafeharbor

HSTS

HTTP 严格传输安全性

加密与安全

一种网络安全政策机制,强制浏览器仅使用 HTTPS 连接。anonym.legal 设置 Strict-Transport-Security: max-age=31536000; includeSubDomains,以防止协议降级攻击和 cookie 劫持。

#hsts
I

ISO 27001

ISO/IEC 27001 信息安全管理

合规与法规

信息安全管理系统 (ISMS) 的国际标准。认证要求有文档政策、风险评估和控制。anonym.legal 的欧盟服务器经过 ISO 27001 认证,确保结构化的安全治理。

#iso27001

ISO 27001 SoA

适用性声明

合规与法规

一份强制性的 ISO 27001 文件,列出所有附录 A 控制措施,指明哪些适用于组织,并提供包含和排除的理由。认证和审计所必需。

#iso27001soa
J

JWT

JSON Web 令牌

加密与安全

一种紧凑的、URL 安全的令牌格式,用于在各方之间传输声明。anonym.legal 使用使用 HS256 签名的 JWT 进行内部服务到服务的认证(例如,前端 → Presidio API)。令牌是短期有效的,并在服务器端进行验证。

#jwt
K

KEK

密钥加密密钥

加密与安全

用于加密其他密钥而不是直接加密数据的密钥。在 anonym.legal 的 ZK 架构中,用户密码短语派生的密钥充当 KEK,以保护存储在加密保险库中的每个文档加密密钥。

#kek
M

MCP

模型上下文协议

平台与产品

由 Anthropic 提出的开放协议,使 AI 模型能够以标准化方式与外部工具和数据源进行交互。anonym.legal 实现了 MCP 服务器,以便 AI 编码工具可以在不离开其工作流程的情况下调用匿名化。

#mcp

MCP 服务器

模型上下文协议服务器

平台与产品

anonym.legal 的 MCP 服务器集成使 AI 编码助手(Claude Desktop、Cursor、VS Code Copilot)能够直接调用匿名化 API 作为工具。PII 在发送到 AI 模型之前从代码、提示和上下文中剥离。

#mcpserver

ML 模型

用于 PII 检测的机器学习模型

检测技术

在标记文本语料库上训练的统计模型,以识别上下文中的 PII。anonym.legal 使用 spaCy 转换器管道和微调的 XLM-RoBERTa 进行生产规模的多语言实体识别。

#mlmodels
N

NER

命名实体识别

检测技术

一种自然语言处理任务,识别和分类文本中的命名实体,并将其分为预定义类别,如人、组织、地点、日期和医疗标识符。驱动 anonym.legal 中 PII 检测的核心机器学习技术。

#ner

NIS2

网络与信息安全指令 2

合规与法规

欧盟指令 2022/2555 扩展了原 NIS 指令,涵盖更多行业(医疗保健、能源、运输、数字基础设施)并加强网络安全要求。所有欧盟成员国将在 2024 年 10 月之前将其转化为国家法律。

#nis2

NLP

自然语言处理

检测技术

人工智能的一个分支,关注计算机与人类语言之间的互动。在 PII 检测中,NLP 模型理解上下文、语法和语义,以识别仅使用正则表达式模式可能遗漏的实体。

#nlp
O

Office 插件

anonym.legal Microsoft Office 插件

平台与产品

将 PII 匿名化直接集成到 Word、Excel 和 PowerPoint 中的 Microsoft Office 扩展。支持文档内编辑、预设管理、ZK Auth 和跨设备同步。可从 Microsoft AppSource 获取。

#officeaddin
P

PCI DSS

支付卡行业数据安全标准

合规与法规

处理支付卡数据的组织的安全标准,由 PCI 安全标准委员会维护。要求加密、访问控制、日志记录和定期测试。不合规可能导致罚款和失去卡处理权限。

#pcidss

PHI

受保护的健康信息

数据隐私与 PII

与可识别个人相关的任何健康信息,在美国受 HIPAA 监管。包括诊断、治疗记录、保险数据和 18 个 HIPAA 安全港标识符中的任何一个。

#phi

PII

个人可识别信息

数据隐私与 PII

任何可以直接或通过其他数据识别特定个人的数据。示例:姓名、电子邮件地址、社保号码、IP 地址、生物识别记录。

#pii

Presidio

微软 Presidio

检测技术

微软的开源数据保护和匿名化 SDK。anonym.legal 的检测引擎建立在 Presidio 的分析器和匿名化服务之上,扩展了 285 多个自定义实体识别器,覆盖 48 种语言。

#presidio

Presidio 分析器

微软 Presidio 分析器服务

基础设施

anonym.legal 后端的检测组件(端口 8011)。接受文本并返回检测到的 PII 实体及其位置、类型和置信分数的列表。扩展了 285 多个自定义识别器,覆盖 48 种语言。

#presidioanalyzer

Presidio 匿名化器

微软 Presidio 匿名化器服务

基础设施

anonym.legal 后端的转换组件(端口 8012)。接受文本和分析结果作为输入,对每个检测到的实体应用所选操作符(REPLACE、REDACT、MASK、HASH、ENCRYPT),并返回匿名化文本。

#presidioanonymizer
R

Regex

正则表达式模式匹配

检测技术

使用形式语言语法的基于模式的文本匹配。在 PII 检测中,正则表达式处理结构上可预测的标识符(电话号码、信用卡、IBAN、电子邮件地址),并进行校验和验证。补充 NER 以实现混合检测。

#regex

REST API

RESTful API

基础设施

anonym.legal 提供 RESTful HTTP API 以进行程序化集成。端点包括 /api/analyze、/api/anonymize、/api/image 和 /api/structured。通过 JWT 承载令牌进行身份验证。完整的 OpenAPI 文档可在 API 参考中获得。

#restapi
S

SCCs

标准合同条款

合规与法规

将个人数据从 EU/EEA 转移到第三国的预先批准的 GDPR 合规合同条款。2021 年由欧盟委员会更新(2021/914/EU),以满足 Schrems II 要求,包括转移影响评估。

#sccs

Schrems II

Schrems II 裁决 (C-311/18)

合规与法规

2020 年欧盟法院裁决无效欧盟-美国隐私保护框架,理由是美国监视法律保护不足。使用标准合同条款时,要求采取补充措施(加密、匿名化)。

#schremsii

SHA-256

安全哈希算法 256 位

加密与安全

一种生成 256 位摘要的密码哈希函数。用于 anonym.legal 的 API 请求 HMAC 认证、ZK 认证证明和一致的实体伪匿名化(加盐哈希为相同原始值生成相同替换)。

#sha256

spaCy

spaCy NLP 库

检测技术

工业级开源 NLP 库,使用 Python 编写。anonym.legal 使用 spaCy 的基于转换器的模型支持 24 种语言(en、de、fr、es、it、pt、nl、pl、ru、zh、ja、ko 等)进行命名实体识别。

#spacy

Stanza

Stanza NLP 库 (斯坦福 NLP)

检测技术

斯坦福 NLP 小组的 Python NLP 工具包,支持 70 多种语言,具有最先进的神经模型。作为 anonym.legal 中的补充 NER 后端,用于 spaCy 模型未覆盖的语言。

#stanza
T

TLS

传输层安全性

加密与安全

保护数据在传输中安全的加密协议。anonym.legal 强制执行 TLS 1.2 最低标准,优先使用 TLS 1.3,HSTS 最大年龄为一年,并使用 HTTP/2。客户端与服务器之间的所有流量在传输中均被加密。

#tls
W

Web 应用

anonym.legal 网络应用程序

平台与产品

anonym.legal 的基于浏览器的界面,用于 PII 分析、匿名化和解密。支持文本输入、文件上传(PDF、DOCX、TXT)、批处理、ZK Auth、48 种语言和 285 种以上的实体类型。无需安装。

#webapp
X

XChaCha20

XChaCha20-Poly1305

加密与安全

一种认证加密算法,在没有 AES 硬件加速的系统上提供高性能。使用 192 位随机数(从 ChaCha20 的 64 位扩展),消除随机数冲突风险。作为 anonym.legal 加密层中的替代密码使用。

#xchacha20

XLM-RoBERTa

跨语言 RoBERTa

检测技术

一种在 100 种语言上训练的多语言转换器语言模型,由 Meta AI 开发。用于 anonym.legal 中的跨语言 NER 任务,特别是对于单语言模型不可用的实体类型和语言。

#xlmroberta
Z

ZK Auth

零知识认证

加密与安全

anonym.legal 的认证系统,其中加密密钥是通过客户端从用户的密码短语使用 Argon2id 派生的,绝不传输到服务器或存储在服务器上。服务器仅存储加密证明,而不是密钥或密码短语。

#zkauth