eDiscovery là quá trình xác định, bảo toàn, tìm kiếm, sản xuất và xem xét dữ liệu điện tử liên quan đến tranh chấp pháp lý hoặc yêu cầu quy định.
Bảy Định Dạng Tệp Phổ Biến
1. PDF: Định dạng dựa trên nội dung cố định. Văn bản bị nhúng dưới dạng pixel, không tách rời. Công cụ OCR cần thiết.
2. Microsoft Word (.DOCX): Định dạng XML được nén. Chứa siêu dữ liệu (tác giả, ngày thay đổi, nhận xét). Công cụ cần trích xuất cả văn bản và siêu dữ liệu.
3. Excel (.XLSX): Nhiều sheet, công thức, bình luận. Dữ liệu nhạy cảm có thể được ẩn (sắp xếp, lọc).
4. Email: Một thông báo email có thể chứa tệp đính kèm (PDF, Word, Excel), hình ảnh và chữ ký HTML.
5. Slack/Teams: Tin nhắn, luồng, phản ứng biểu cảm, tệp đính kèm.
6. Video/Audio: Phụ đề, phiên âm, nhân vật. Công cụ cần xử lý ngôn ngữ nói.
7. Hình Ảnh: Ảnh chụp màn hình, tài liệu quét. OCR + phát hiện khuôn mặt cần thiết.
Tại Sao GDPR Quan Tâm?
Nếu một tổ chức liên quan đến tranh chấp pháp lý hoặc điều tra quy định, GDPR vẫn áp dụng. Các dữ liệu cá nhân trong bất kỳ định dạng nào phải được bảo vệ.
Sources: