By · Last updated 2026-03-10

返回博客GDPR 与合规

开源文档匿名化:LibreOffice 实践指南

公共部门机构如何借助 LibreOffice 与 anonym.legal 扩展实现符合 GDPR 合规要求的文档匿名化。

March 10, 20269 分钟阅读
LibreOffice extensiongovernment anonymizationpublic sector GDPRopen source complianceuniversity data protection

使用 LibreOffice 实现开源文档匿名化

欧盟各国政府正在加速向开源软件迁移。意大利、法国、德国和西班牙均已制定正式政策。德国石勒苏益格-荷尔斯泰因州于 2024 年将 25,000 台政府电脑迁移至 LibreOffice。法国宪兵队在 GendBuntu 上运行 77,000+ 台工作站——这是一个基于 Linux、预装 LibreOffice 的发行版。

这些机构需要符合 GDPR 的匿名化工具,但大多数个人信息处理工具仅支持 Microsoft Office,由此留下了合规缺口。

anonym.legal 的 LibreOffice 扩展填补了这一空白。它可在 Writer、Calc 和 Impress 中检测 285+ 种实体类型,支持 Windows、macOS 和 Linux 平台。

为何开源软件适合公共部门

无供应商绑定

Microsoft 365 需要按年付费,LibreOffice 则完全免费。对于拥有大量桌面终端的机构而言,这是可观的成本节约。但成本并非唯一原因。

开源代码可供审查。任何机构都可以查阅其工作原理。对于持有公民档案的政府机构而言,这不仅是技术选择,更是法律层面的必要要求。

数据留存于欧盟境内

anonym.legal 运行在德国 Hetzner 服务器上,文件不会离开欧盟。使用 LibreOffice 时,不存在 Microsoft 云端连接,整个工作流程在同一可控环境中完成。

内置隐私保护设计

GDPR 第 25 条要求将隐私保护嵌入每一个处理环节。将文本复制到外部工具的做法不符合这一要求。扩展程序直接在编辑器内运行,删除个人信息是编辑步骤的组成部分——无需额外应用,无复制粘贴风险。

三个典型应用场景

政府数据主体访问请求(DSAR)答复

公民有权申请查阅其个人档案,机构必须予以答复,同时须先屏蔽文件中其他人员的信息。

使用扩展的操作流程:

  1. 在 Writer 中打开答复文件
  2. 点击「分析」
  3. 检查预览——保留申请公民的自身信息,删除其他所有信息
  4. 应用更改并发送

预览功能至关重要。DSAR 需要有选择性地删除,而非整体屏蔽。每个实体均可逐一接受或跳过。

高校研究档案

研究团队在共享研究成果前必须删除受试者姓名。一个项目可能包含:

  • 含有姓名和联系方式的 Calc 电子表格
  • 含有受试者引述内容的 Writer 访谈记录
  • 含有案例详情的 Impress 演示幻灯片

一个扩展程序即可处理全部三种文件类型,预设功能确保整个项目统一适用相同规则。

法院文书脱敏

发布裁判文书的法院必须删除姓名、地址及其他个人信息。扩展提供三种处理模式:

  • 替换: 姓名变为「PERSON_1」「PERSON_2」——同一标签在文中保持一致
  • 脱敏: 地址被完全删除
  • 掩码: 对日期或案号进行部分隐藏,保留必要上下文

Writer 可完整保留所有格式,页眉、页脚和编号列表在处理后保持原状。

部署方式

个人用户:

  1. anonym.legal/api/download/libreoffice 下载 .oxt 文件
  2. 双击安装
  3. 重启 LibreOffice

IT 团队部署: 通过网络驱动器、Ansible 或 SCCM 分发 .oxt 文件。LibreOffice 支持通过命令行静默安装扩展,无需用户交互。团队可通过同一 anonym.legal 账户共享预设,确保组内每位用户适用相同规则。

GDPR 合规对应表

GDPR 条款合规实现方式
第 5(1)(c) 条 — 数据最小化仅处理已识别的个人信息,其余文本保持不变
第 25 条 — 内置隐私保护删除操作在编辑器内完成,无需外部工具
第 32 条 — 安全性AES-256-GCM 加密、零知识认证、ISO 27001 服务器
前言 26 — 匿名化替换、脱敏和掩码使内容脱离 GDPR 适用范围
第 4(5) 条 — 假名化加密模式提供可逆的假名化处理
BDSG 第 22 条检测范围涵盖健康、生物特征和民族来源等字段

立即使用

  1. 下载扩展程序 — 免费
  2. anonym.legal 注册账户 — 免费套餐:每月 200 个代币
  3. 阅读完整文档

付费套餐起价为每月 3 欧元,包含 1,000 个代币,大容量套餐同样可选。

如需批量处理大量请求的机构,请参阅 GDPR DSAR 大规模批量处理方案

数据来源

  • 欧盟委员会开源软件战略 2020-2023
  • 石勒苏益格-荷尔斯泰因州政府 — 25,000 台电脑迁移至 LibreOffice(2024年)
  • 法国宪兵队 — 77,000+ 台 GendBuntu 工作站(截至 2019 年)
  • GDPR 第 4(5)、5(1)(c)、25、32 条及前言 26
  • BDSG 第 22 条 — 德国联邦数据保护法

准备好保护您的数据了吗?

开始使用 285 种实体类型在 48 种语言中匿名化 PII。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.