Ẩn danh hóa tài liệu mã nguồn mở với LibreOffice
Các chính phủ EU đang chuyển sang phần mềm mã nguồn mở. Italy, Pháp, Đức và Tây Ban Nha đều có chính sách chính thức về điều này. Schleswig-Holstein của Đức đã chuyển 25.000 máy tính chính phủ sang LibreOffice vào năm 2024. Lực lượng Gendarmerie Pháp vận hành hơn 77.000 máy trạm trên GendBuntu. Đó là bản Linux với LibreOffice.
Các cơ quan này cần ẩn danh hóa tuân thủ GDPR. Nhưng hầu hết các công cụ PII chỉ hoạt động với Microsoft Office. Điều đó để lại một khoảng trống.
Extension LibreOffice của anonym.legal lấp đầy khoảng trống này. Nó phát hiện hơn 285 loại thực thể trong Writer, Calc và Impress. Nó chạy trên Windows, macOS và Linux.
Tại sao mã nguồn mở phù hợp với khu vực công
Không bị phụ thuộc nhà cung cấp
Microsoft 365 tốn tiền mỗi năm. LibreOffice là miễn phí. Đối với các cơ quan có nhiều máy tính để bàn, đây là khoản tiết kiệm lớn. Nhưng chi phí không phải là lý do duy nhất.
Code mã nguồn mở có thể được kiểm tra. Bất kỳ cơ quan nào cũng có thể đọc cách nó hoạt động. Đối với các cơ quan lưu giữ tệp công dân, đây là nhu cầu pháp lý. Đây không phải là sự lựa chọn.
Dữ liệu ở lại trong EU
anonym.legal chạy trên máy chủ Hetzner tại Đức. Không có tệp nào rời khỏi EU. Với LibreOffice, không có liên kết đám mây Microsoft nào. Toàn bộ quy trình làm việc ở lại trong một nơi.
Quyền riêng tư theo thiết kế
GDPR Điều 25 yêu cầu quyền riêng tư được tích hợp vào mọi bước. Sao chép văn bản vào một công cụ bên ngoài không đáp ứng quy tắc này. Extension hoạt động bên trong editor. Xóa thông tin cá nhân là một phần của bước chỉnh sửa. Không cần ứng dụng thêm. Không có rủi ro sao chép-dán.
Ba trường hợp sử dụng thực tế
Phản hồi DSAR của chính phủ
Công dân có thể yêu cầu hồ sơ của họ. Các cơ quan phải gửi chúng. Nhưng họ cũng phải ẩn bất kỳ thông tin của người khác trước tiên.
Với extension:
- Mở phản hồi trong Writer
- Nhấp Phân tích
- Kiểm tra xem trước — giữ thông tin của chính công dân, xóa tất cả những thông tin khác
- Áp dụng và gửi
Xem trước là chìa khóa. DSAR cần xóa có chọn lọc, không phải che giấu toàn bộ. Mỗi thực thể có thể được chấp nhận hoặc bỏ qua từng cái một.
Tệp nghiên cứu của trường đại học
Các nhóm nghiên cứu phải xóa tên trước khi chia sẻ kết quả nghiên cứu. Một dự án có thể bao gồm:
- Các sheet Calc với tên và thông tin liên lạc
- Các bản ghi Writer với trích dẫn từ đối tượng nghiên cứu
- Các slide Impress với chi tiết ca bệnh cho một buổi thuyết trình
Một extension xử lý cả ba loại tệp. Preset giữ các quy tắc giống nhau trên toàn bộ dự án.
Xóa dữ liệu tài liệu tòa án
Các tòa án xuất bản các phán quyết phải xóa tên, địa chỉ và các thông tin cá nhân khác. Extension có ba chế độ:
- Thay thế: Tên trở thành PERSON_1, PERSON_2 — cùng nhãn mỗi lần
- Xóa: Địa chỉ bị xóa hoàn toàn
- Che giấu: Ẩn một phần cho ngày tháng hoặc số vụ án nơi một số ngữ cảnh phải được giữ lại
Writer giữ nguyên tất cả định dạng. Tiêu đề, chân trang và danh sách có đánh số vẫn còn sau bất kỳ thay đổi nào.
Cách triển khai
Người dùng đơn lẻ:
- Tải
.oxttừ anonym.legal/api/download/libreoffice - Nhấp đúp và cài đặt
- Khởi động lại LibreOffice
Triển khai nhóm IT:
Chia sẻ .oxt qua ổ đĩa mạng, Ansible hoặc SCCM. LibreOffice có thể cài đặt extension từ dòng lệnh mà không cần prompt người dùng. Các nhóm có thể chia sẻ preset qua một tài khoản anonym.legal. Điều này giữ các quy tắc giống nhau cho mọi người dùng trong nhóm.
Bảng tuân thủ GDPR
| Quy tắc GDPR | Cách đáp ứng |
|---|---|
| Điều 5(1)(c) — Tối thiểu hóa dữ liệu | Chỉ PII được tìm thấy mới được thay đổi; tất cả văn bản khác giữ nguyên |
| Điều 25 — Quyền riêng tư theo thiết kế | Xóa chạy bên trong editor, không phải trong công cụ riêng biệt |
| Điều 32 — Bảo mật | AES-256-GCM, xác thực zero-knowledge, máy chủ ISO 27001 |
| Recital 26 — Ẩn danh hóa | Thay thế, Xóa và Che giấu đưa nội dung ra khỏi phạm vi GDPR |
| Điều 4(5) — Pseudonymization | Chế độ Mã hóa cung cấp pseudonymization có thể đảo ngược |
| BDSG Điều 22 | Phát hiện bao gồm các trường sức khỏe, sinh trắc học và nguồn gốc dân tộc |
Bắt đầu
- Tải extension — miễn phí
- Đăng ký tại anonym.legal — gói miễn phí: 200 token mỗi tháng
- Đọc tài liệu đầy đủ
Các gói trả phí bắt đầu từ EUR 3 mỗi tháng cho 1.000 token. Các mức số lượng cao hơn cũng có sẵn.
Đối với các cơ quan xử lý nhiều yêu cầu cùng lúc, xem Xử lý hàng loạt DSAR GDPR theo Quy mô.
Nguồn tham khảo
- Chiến lược Phần mềm Mã nguồn Mở của Ủy ban Châu Âu 2020-2023
- Chính quyền Schleswig-Holstein — Chuyển 25.000 PC sang LibreOffice (2024)
- Lực lượng Gendarmerie Pháp — Hơn 77.000 máy trạm GendBuntu (đến năm 2019)
- GDPR Điều 4(5), 5(1)(c), 25, 32, Recital 26
- BDSG Điều 22 — Luật Bảo vệ Dữ liệu Liên bang Đức