Data Terstruktur vs Format-Bebas: Pendekatan Anonimisasi Berbeda
GDPR dan CCPA mendefinisikan data personal sebagai "informasi apa pun yang berhubungan dengan individu yang dapat diidentifikasi." Ini mencakup data terstruktur (spreadsheet, database) dan dokumen naratif (email, file word).
Namun, teknik anonimisasi berbeda untuk kedua kategori:
Format Bebas (Dokumen Naratif):
- Identifikasi PII dalam alur teks naratif
- Redaksi atau ganti teks
- Pertahankan alur naratif pembacaan
Data Terstruktur (Spreadsheet/Database):
- Identifikasi PII dalam kolom dan tabel
- Transformasi nilai kolom (ganti, hash, topeng, kemasan)
- Pertahankan integritas kolom lintas tabel
Spreadsheet Excel secara khusus menghadirkan tantangan:
- Kolom dapat berisi data terstruktur (nomor, tanggal) atau semi-terstruktur (kode campuran, teks)
- Hubungan kolom lintas sheet (referensi eksternal, pivot table)
- Macro dan logika formula yang tergantung pada nilai asli