Quay lại BlogKỹ Thuật

Vấn Đề Phân Mảnh Định Dạng Tài Liệu...

Một phản hồi DSAR có thể bao gồm các hợp đồng Word, hóa đơn PDF, trang tính Excel, email, ảnh chụp màn hình.

April 21, 20267 phút đọc
document formatsPDF anonymizationExcel GDPRbatch processingDSAR compliance

Phân Mảnh Định Dạng Tài Liệu: Thách Thức Vô Danh Hóa

Cảnh Quay: DSAR Điển Hình

Khách hàng yêu cầu: "Cung cấp cho tôi tất cả dữ liệu cá nhân của bạn có về tôi."

Tập dữ liệu bao gồm:

  • Hợp đồng: .DOCX, .ODT (Word)
  • Hóa đơn: .PDF (không quét, không quét)
  • Ghi chép: .XLSX, .ODS (Excel)
  • Email: .EML, .MSG
  • Ảnh: .PNG, .JPG (Ảnh chụp màn hình, fax được quét)
  • Tệp nhạc: .MP3 (Ghi âm cuộc gọi, danh sách phát)
  • Cơ sở dữ liệu: .CSV, .JSON (Xuất)

Vô danh hóa tất cả 7 định dạng với một công cụ:

  1. Word — Xóa nội dung, thay thế, giữ cấu trúc
  2. PDF — OCR, sau đó vô danh hóa, sau đó xuất
  3. Excel — Vô danh hóa ô + công thức + bảng pivot
  4. Email — Người đưa thư vào, cc, bcc + nội dung
  5. Hình ảnh — OCR, sau đó vô danh hóa
  6. Audio — Chép âm thanh hoặc phát hiện người nói?
  7. CSV — Vô danh hóa cột

Mỗi định dạng có những thách thức riêng của nó.

Sẵn sàng bảo vệ dữ liệu của bạn?

Bắt đầu ẩn danh PII với 285+ loại thực thể trên 48 ngôn ngữ.