By · Last updated 2026-03-10

Quay lại BlogKỹ Thuật

Extension Ẩn danh hóa PII cho LibreOffice

Hướng dẫn từng bước để ẩn danh hóa PII trong tài liệu LibreOffice bằng extension anonym.legal.

March 10, 202610 phút đọc
LibreOffice extensiondocument anonymizationPII redactionopen source officeWriter anonymizationformat preservation

Extension Ẩn danh hóa PII cho LibreOffice

LibreOffice có khoảng 200 triệu người dùng trên toàn thế giới. Chính phủ, trường học và doanh nghiệp đều phụ thuộc vào nó. Nhiều người dùng nó để tránh phí bản quyền phần mềm tốn kém. Nhưng cho đến nay, người dùng không có công cụ tích hợp để tìm và xóa dữ liệu cá nhân khỏi các tệp của họ.

Cách cũ rất đau đầu. Sao chép văn bản vào ứng dụng web. Ẩn danh hóa nó. Dán lại. Điều này phá vỡ định dạng. Nó làm hỏng bảng, kiểu và bố cục. Đối với các tài liệu Writer phức tạp, cách này không hoạt động.

Extension anonym.legal giải quyết điều này. Nó hoạt động bên trong ứng dụng. Nó phát hiện hơn 285 loại thực thể trong Writer, Calc và Impress.

Cài đặt trong dưới hai phút

Extension đi kèm dưới dạng tệp .oxt. Đây là định dạng chuẩn cho tất cả các extension.

Cài đặt nhanh:

  1. Tải .oxt từ anonym.legal/api/download/libreoffice
  2. Nhấp đúp vào tệp
  3. Xác nhận prompt
  4. Khởi động lại

Cài đặt thủ công:

  1. Mở ứng dụng
  2. Vào Công cụ, sau đó Trình quản lý Extension
  3. Nhấp Thêm, rồi chọn tệp .oxt
  4. Khởi động lại

Sau khi khởi động lại, thanh bên anonym.legal hiển thị trong Xem, sau đó Thanh bên. Đăng nhập để bắt đầu.

Cách phát hiện hoạt động

Hai engine chạy cùng nhau để tìm PII.

EngineTìmĐộ tin cậy
RegexEmail, SSN, IBAN, thẻ tín dụng, số điện thoại1,0
spaCy NLPTên người, tổ chức, địa điểm0,85+

Phát hiện chạy trên API anonym.legal. Văn bản đến các máy chủ được chứng nhận ở Đức. Các máy chủ có chứng nhận ISO 27001. Kết quả trả về extension. Không có tệp tài liệu nào được gửi. Chỉ văn bản được truyền.

Mỗi ứng dụng làm gì:

  • Writer: Trích xuất văn bản đầy đủ hoặc chỉ phần chọn
  • Calc: Đọc các ô dưới dạng giá trị phân tách bằng tab trên tất cả các sheet
  • Impress: Đọc các đối tượng văn bản từ tất cả các slide

Năm phương pháp ẩn danh hóa

Phương phápVí dụCó thể đảo ngược?Phân loại GDPR
Thay thếJohn Smith → PERSONKhôngẨn danh hóa (Recital 26)
Che giấujohn@example.com → j***@e***.comKhôngẨn danh hóa
Xóa555-0123 → [REDACTED]KhôngẨn danh hóa
Hash (SHA-256/512)SSN → a1b2c3d4...KhôngPseudonymization (WP29)
Mã hóa (AES-256-GCM)Tên → ENC:xyz...Pseudonymization (Điều 4(5))

Bạn có thể kết hợp các phương pháp trong một lần. Thay thế tên, nhưng mã hóa email. Mỗi loại thực thể có quy tắc riêng.

Định dạng giữ nguyên trong Writer

Đây là ưu điểm then chốt so với sao chép-dán. Extension giữ nguyên tất cả định dạng khi thay thế văn bản.

Bảy thuộc tính font được bảo toàn:

  • Họ font, cỡ, đậm, nghiêng, màu, gạch chân, gạch ngang

Bốn thuộc tính đoạn văn được bảo toàn:

  • Căn lề, thụt đầu dòng đầu tiên, lề trái, lề phải

"John Smith" in đậm 14pt Times New Roman trở thành "PERSON" với cùng kiểu. Bảng, tiêu đề và chân trang đều giữ nguyên. Extension hoạt động bên trong mô hình tài liệu. Nó không xuất và nhập lại văn bản.

Lưu ý: Theo dõi định dạng chỉ áp dụng cho Writer. Calc và Impress chỉ thực hiện thay thế ở cấp văn bản.

Xem trước trước khi Áp dụng

Xem trước hiển thị tối đa 50 thực thể được tìm thấy. Mỗi hàng hiển thị:

  • Loại thực thể (PERSON, EMAIL_ADDRESS, PHONE_NUMBER, v.v.)
  • Văn bản gốc
  • Thay thế đề xuất
  • Điểm tin cậy

Chấp nhận hoặc từ chối từng thực thể một. Chọn tất cả hoặc xóa tất cả bằng một cú nhấp. Không có gì thay đổi cho đến khi bạn nhấp Áp dụng. Trong Writer, Ctrl+Z hoàn tác thao tác cuối cùng.

Preset đồng bộ trên các thiết bị

Lưu cài đặt của bạn làm preset. Chọn loại thực thể, phương pháp và ngưỡng. Sử dụng lại trên tất cả tài liệu của bạn. Điều này tiết kiệm thời gian.

Trên các gói trả phí, preset đồng bộ trên tất cả sản phẩm anonym.legal. Thiết lập một cái trong ứng dụng web. Nó xuất hiện trong ứng dụng desktop và Office Add-in trong vòng năm phút. Khóa mã hóa dùng bao bọc zero-knowledge. Chỉ mật khẩu của bạn mới có thể giải mã chúng.

Để biết thêm về cách Office Add-in xử lý quy trình tương tự trong Word, xem Xóa dữ liệu Word Add-in cho Công ty Luật.

LibreOffice so với Microsoft Office

Cả hai extension chia sẻ cùng backend. Cùng một văn bản cho cùng kết quả trong Writer và trong Word. Engine là một và như nhau.

Tính năngLibreOffice ExtensionOffice Add-in
Loại thực thể285+285+
Ngôn ngữ4848
Phương pháp55
Theo dõi định dạngChỉ WriterChỉ Word
Xem trướcTối đa 50 thực thểTối đa 50 thực thể
Xác thực ZK
Đồng bộ presetCó (gói trả phí)Có (gói trả phí)
Nền tảngWindows, macOS, LinuxWindows, Mac, Web, iPad

Để có cái nhìn rộng hơn về tuân thủ PII trên các hệ điều hành, xem Tuân thủ PII Đa nền tảng: Mac, Linux, Windows.

Yêu cầu hệ thống

  • LibreOffice 3.0 trở lên
  • Python 3 (được đi kèm với hầu hết các cài đặt)
  • Kết nối internet (cho API phát hiện PII)
  • Tài khoản anonym.legal (gói miễn phí: 200 token/tháng)

Bắt đầu

  1. Tải extension
  2. Nhấp đúp để cài đặt, sau đó khởi động lại
  3. Mở Xem → Thanh bên → Bảng anonym.legal
  4. Đăng nhập
  5. Mở tài liệu, nhấp Phân tích, xem xét, nhấp Áp dụng

Tài liệu đầy đủ: Tài liệu Extension LibreOffice

Nguồn tham khảo

  • The Document Foundation — ước tính hơn 200 triệu người dùng LibreOffice trên toàn thế giới
  • Kiểm tra Phát hiện PII anonym.legal — độ chính xác 95,5%, 42/44 bài kiểm tra độc lập
  • GDPR Recital 26 — ẩn danh hóa xóa dữ liệu khỏi phạm vi GDPR; Điều 4(5) — định nghĩa pseudonymization

Sẵn sàng bảo vệ dữ liệu của bạn?

Bắt đầu ẩn danh PII với 285+ loại thực thể trên 48 ngôn ngữ.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.