Spreadsheet Bukan Dokumen Biasa
File Word adalah aliran teks. File Excel adalah sesuatu yang berbeda. Sel menunjuk ke sel lain. Formula beroperasi pada rentang data. Tabel pivot mengelompokkan data bernama. Makro menelusuri seluruh buku kerja. Sebagian besar alat redaksi memperlakukan Excel seperti dokumen teks. Ini adalah model yang keliru.
Berikut contoh sederhana. Kolom A berisi nama pelanggan. Kolom D berisi formula: =VLOOKUP(A2, CustomerTable, 5, FALSE). Formula ini mengambil saldo akun menggunakan nama. Anda mengganti nama di kolom A tetapi tidak memperbarui formula maupun tabel referensi. Formula tetap mengembalikan saldo nyata untuk nama asli. File tampak bersih. Padahal tidak.
Ini umum terjadi pada file Excel perusahaan. Data hidup dalam relasi — bukan hanya di sel. Mengganti nilai sel tanpa melacak relasi tersebut meninggalkan data pribadi yang terekspos.
GDPR Pasal 28 dan Berbagi Data Eksternal
Pasal 28 GDPR mengatur berbagi data dengan pengolah data. Jika Anda mengirim data pribadi ke konsultan, vendor, atau auditor, Anda perlu memiliki jaminan teknis yang memadai.
Misalkan Anda perlu berbagi file pelanggan berisi 50.000 baris dengan vendor analitik. Ekspor PDF menghilangkan formula dan memecah file besar dengan pemformatan kompleks. CSV menghilangkan formula dan tabel pivot. Tidak ada opsi yang memberikan dataset yang dapat digunakan kepada vendor.
Satu-satunya solusi yang layak adalah melakukan anonimisasi di dalam format Excel asli. Ganti nilai yang mengidentifikasi. Pertahankan struktur. Vendor menerima file yang berfungsi. Persyaratan jaminan GDPR terpenuhi.
Lingkungan Air-Gapped
67% spesifikasi kontrak pemerintah dan pertahanan menyebutkan persyaratan lingkungan air-gapped (DISA 2024). Kontraktor pertahanan mengelola data personel, catatan logistik, dan file pengadaan di Excel. Mereka tidak dapat menggunakan alat berbasis cloud. Data tidak boleh meninggalkan jaringan yang dikontrol.
Aplikasi Desktop menyelesaikan masalah ini. Aplikasi memproses file Excel di mesin lokal. Tidak ada panggilan jaringan selama pemrosesan. File output tidak pernah meninggalkan lingkungan air-gapped. Tim internal dapat berbagi file yang bersih di dalam jaringan yang dikontrol.
Ini memenuhi profil teknis yang dibutuhkan untuk kepatuhan kontrak pemerintah.
Tiga Lapisan Kecerdasan Sel
Anonimisasi Excel yang baik beroperasi pada tiga lapisan sekaligus.
Lapisan nilai: Mengidentifikasi dan mengganti data pribadi di sel individual. Nama, email, nomor telepon, dan dokumen identitas ditandai menggunakan mesin deteksi yang sama seperti pemrosesan dokumen.
Lapisan formula: Mengidentifikasi sel yang formulanya merujuk sel berisi data pribadi. Memperbarui referensi tersebut agar menunjuk ke nilai yang dianonimkan. Atau mengganti formula dengan hasilnya untuk memblokir eksposur melalui formula.
Lapisan struktur: Menghapus cache data tabel pivot. Memproses baris dan kolom tersembunyi. Menangani kode makro VBA yang menggunakan alamat atau nilai sel tertentu.
Ketiga lapisan harus beroperasi bersama. Memperbaiki nilai tanpa memperbaiki formula meninggalkan data pribadi yang terekspos. Memperbaiki formula tanpa mengosongkan cache menghasilkan efek yang sama.
Tantangan ini meluas ke semua format file. Lihat bagaimana fragmentasi format memengaruhi deteksi data pribadi untuk gambaran yang lebih luas.
Untuk tim yang bekerja dengan data terstruktur melalui API, lihat minimisasi data GDPR dalam API real-time.
Jika tim Anda menangani ekspor DSAR bervolume besar, lihat pemrosesan batch GDPR DSAR dalam skala besar untuk pola alur kerja yang berlaku.