Extension Ẩn danh hóa PII cho LibreOffice
LibreOffice có khoảng 200 triệu người dùng trên toàn thế giới. Chính phủ, trường học và doanh nghiệp đều phụ thuộc vào nó. Nhiều người dùng nó để tránh phí bản quyền phần mềm tốn kém. Nhưng cho đến nay, người dùng không có công cụ tích hợp để tìm và xóa dữ liệu cá nhân khỏi các tệp của họ.
Cách cũ rất đau đầu. Sao chép văn bản vào ứng dụng web. Ẩn danh hóa nó. Dán lại. Điều này phá vỡ định dạng. Nó làm hỏng bảng, kiểu và bố cục. Đối với các tài liệu Writer phức tạp, cách này không hoạt động.
Extension anonym.legal giải quyết điều này. Nó hoạt động bên trong ứng dụng. Nó phát hiện hơn 285 loại thực thể trong Writer, Calc và Impress.
Cài đặt trong dưới hai phút
Extension đi kèm dưới dạng tệp .oxt. Đây là định dạng chuẩn cho tất cả các extension.
Cài đặt nhanh:
- Tải
.oxttừ anonym.legal/api/download/libreoffice - Nhấp đúp vào tệp
- Xác nhận prompt
- Khởi động lại
Cài đặt thủ công:
- Mở ứng dụng
- Vào Công cụ, sau đó Trình quản lý Extension
- Nhấp Thêm, rồi chọn tệp
.oxt - Khởi động lại
Sau khi khởi động lại, thanh bên anonym.legal hiển thị trong Xem, sau đó Thanh bên. Đăng nhập để bắt đầu.
Cách phát hiện hoạt động
Hai engine chạy cùng nhau để tìm PII.
| Engine | Tìm | Độ tin cậy |
|---|---|---|
| Regex | Email, SSN, IBAN, thẻ tín dụng, số điện thoại | 1,0 |
| spaCy NLP | Tên người, tổ chức, địa điểm | 0,85+ |
Phát hiện chạy trên API anonym.legal. Văn bản đến các máy chủ được chứng nhận ở Đức. Các máy chủ có chứng nhận ISO 27001. Kết quả trả về extension. Không có tệp tài liệu nào được gửi. Chỉ văn bản được truyền.
Mỗi ứng dụng làm gì:
- Writer: Trích xuất văn bản đầy đủ hoặc chỉ phần chọn
- Calc: Đọc các ô dưới dạng giá trị phân tách bằng tab trên tất cả các sheet
- Impress: Đọc các đối tượng văn bản từ tất cả các slide
Năm phương pháp ẩn danh hóa
| Phương pháp | Ví dụ | Có thể đảo ngược? | Phân loại GDPR |
|---|---|---|---|
| Thay thế | John Smith → PERSON | Không | Ẩn danh hóa (Recital 26) |
| Che giấu | john@example.com → j***@e***.com | Không | Ẩn danh hóa |
| Xóa | 555-0123 → [REDACTED] | Không | Ẩn danh hóa |
| Hash (SHA-256/512) | SSN → a1b2c3d4... | Không | Pseudonymization (WP29) |
| Mã hóa (AES-256-GCM) | Tên → ENC:xyz... | Có | Pseudonymization (Điều 4(5)) |
Bạn có thể kết hợp các phương pháp trong một lần. Thay thế tên, nhưng mã hóa email. Mỗi loại thực thể có quy tắc riêng.
Định dạng giữ nguyên trong Writer
Đây là ưu điểm then chốt so với sao chép-dán. Extension giữ nguyên tất cả định dạng khi thay thế văn bản.
Bảy thuộc tính font được bảo toàn:
- Họ font, cỡ, đậm, nghiêng, màu, gạch chân, gạch ngang
Bốn thuộc tính đoạn văn được bảo toàn:
- Căn lề, thụt đầu dòng đầu tiên, lề trái, lề phải
"John Smith" in đậm 14pt Times New Roman trở thành "PERSON" với cùng kiểu. Bảng, tiêu đề và chân trang đều giữ nguyên. Extension hoạt động bên trong mô hình tài liệu. Nó không xuất và nhập lại văn bản.
Lưu ý: Theo dõi định dạng chỉ áp dụng cho Writer. Calc và Impress chỉ thực hiện thay thế ở cấp văn bản.
Xem trước trước khi Áp dụng
Xem trước hiển thị tối đa 50 thực thể được tìm thấy. Mỗi hàng hiển thị:
- Loại thực thể (PERSON, EMAIL_ADDRESS, PHONE_NUMBER, v.v.)
- Văn bản gốc
- Thay thế đề xuất
- Điểm tin cậy
Chấp nhận hoặc từ chối từng thực thể một. Chọn tất cả hoặc xóa tất cả bằng một cú nhấp. Không có gì thay đổi cho đến khi bạn nhấp Áp dụng. Trong Writer, Ctrl+Z hoàn tác thao tác cuối cùng.
Preset đồng bộ trên các thiết bị
Lưu cài đặt của bạn làm preset. Chọn loại thực thể, phương pháp và ngưỡng. Sử dụng lại trên tất cả tài liệu của bạn. Điều này tiết kiệm thời gian.
Trên các gói trả phí, preset đồng bộ trên tất cả sản phẩm anonym.legal. Thiết lập một cái trong ứng dụng web. Nó xuất hiện trong ứng dụng desktop và Office Add-in trong vòng năm phút. Khóa mã hóa dùng bao bọc zero-knowledge. Chỉ mật khẩu của bạn mới có thể giải mã chúng.
Để biết thêm về cách Office Add-in xử lý quy trình tương tự trong Word, xem Xóa dữ liệu Word Add-in cho Công ty Luật.
LibreOffice so với Microsoft Office
Cả hai extension chia sẻ cùng backend. Cùng một văn bản cho cùng kết quả trong Writer và trong Word. Engine là một và như nhau.
| Tính năng | LibreOffice Extension | Office Add-in |
|---|---|---|
| Loại thực thể | 285+ | 285+ |
| Ngôn ngữ | 48 | 48 |
| Phương pháp | 5 | 5 |
| Theo dõi định dạng | Chỉ Writer | Chỉ Word |
| Xem trước | Tối đa 50 thực thể | Tối đa 50 thực thể |
| Xác thực ZK | Có | Có |
| Đồng bộ preset | Có (gói trả phí) | Có (gói trả phí) |
| Nền tảng | Windows, macOS, Linux | Windows, Mac, Web, iPad |
Để có cái nhìn rộng hơn về tuân thủ PII trên các hệ điều hành, xem Tuân thủ PII Đa nền tảng: Mac, Linux, Windows.
Yêu cầu hệ thống
- LibreOffice 3.0 trở lên
- Python 3 (được đi kèm với hầu hết các cài đặt)
- Kết nối internet (cho API phát hiện PII)
- Tài khoản anonym.legal (gói miễn phí: 200 token/tháng)
Bắt đầu
- Tải extension
- Nhấp đúp để cài đặt, sau đó khởi động lại
- Mở Xem → Thanh bên → Bảng anonym.legal
- Đăng nhập
- Mở tài liệu, nhấp Phân tích, xem xét, nhấp Áp dụng
Tài liệu đầy đủ: Tài liệu Extension LibreOffice
Nguồn tham khảo
- The Document Foundation — ước tính hơn 200 triệu người dùng LibreOffice trên toàn thế giới
- Kiểm tra Phát hiện PII anonym.legal — độ chính xác 95,5%, 42/44 bài kiểm tra độc lập
- GDPR Recital 26 — ẩn danh hóa xóa dữ liệu khỏi phạm vi GDPR; Điều 4(5) — định nghĩa pseudonymization