スプレッドシートのコンプライアンスギャップ
PDFの赤外線ツールはExcelスプレッドシートを処理できません。この単一の事実は、Excel形式で個人データを保存する組織にとって体系的なコンプライアンスギャップを生み出します — 企業環境では、これはほぼすべての人事部門、財務チーム、および運用部門を意味します。
EDPBの年次報告書のデータは、GDPRのアクセス権請求が2021年から2024年にかけて180%増加したことを示しています。DSARを受け取った組織は、リクエスターの個人データをポータブルな形式で提供し、同じデータセットに含まれる第三者データが適切に保護されていることを確認する必要があります。Excelに保存された従業員データセットに対して、標準的な応答 — 特定の行をエクスポートすること — は、同じファイル内の他の従業員のデータを依然として露出させます。適切なDSARコンプライアンスには、リクエスター以外のデータのレコードごとの匿名化が必要です。
平均的なDSARの処理には手動で12時間かかります。月に200件のDSARを受け取る組織 — 中規模企業にとっては控えめなボリューム — にとって、これはコンプライアンスのオーバーヘッドで月に2400人時を表します。手動のアプローチは、EDPBデータがこの10年間の残りの期間に予測するリクエストのボリュームにはスケールしません。
Excel匿名化に実際に必要なもの
スプレッドシートの匿名化は、PDFの赤外線ツールが処理するようには設計されていない課題を提示します。
隠れた行と列: Excelファイルには、隠れた行(ドラフトデータ、フィルタリングされたレコード)や隠れた列(中間計算、変換前の元の値)が含まれていることが一般的です。可視セルのみを処理する赤外線ツールは、隠れたPIIをそのまま残します。コンプライアンスグレードのExcel匿名化ツールは、隠れたシートを含むすべてのシートを処理する必要があります。
埋め込まれた数式: PIIを参照する他のセルを含む数式を持つセルは、派生値を表示することがありますが、数式自体は元のデータを参照しています。表示値を匿名化しても数式の参照を更新しないと、元のPIIが数式を検査する誰にでもアクセス可能なままになります。
ピボットテーブルキャッシュ: Excelのピボットテーブルは、ピボットを生成するために使用される基礎データをキャッシュします。ソースデータシートを匿名化しても、ピボットキャッシュは自動的にクリアされません。「匿名化された」Excelファイルを受け取った悪意のあるユーザーは、ピボットキャッシュを検査して元のデータを回復できます。
シート間の参照: 企業のExcelファイルには、シート間のセル参照が通常含まれています。従業員の名前がシート1に表示され、シート3の計算で参照されることがあります。シート1を匿名化しても、シート3の参照を更新しないと、匿名化されたデータへの参照が残り、数式の検査を通じて元の値が明らかになる可能性があります。
人事部門のユースケース
ドイツの製造会社は、ベンチマークプロジェクトのために外部の報酬コンサルタントと50,000件の従業員記録を共有する必要があります。GDPR第28条は、プロセッサ(外部コンサルタント)との個人データの共有には適切な技術的コントロールが必要であることを要求しています。Excelファイルには、名前、個人のメールアドレス、自宅の住所、給与、パフォーマンス評価、医療休暇記録を含む37の列があります。
37の列にわたる50,000行の手動匿名化は、いかなるコンプライアンスのタイムフレームでも実現不可能です。WordおよびExcelアドインは、スプレッドシートをネイティブに処理します — Microsoft Excel内で、エクスポートや変換なしに。セルレベルのPII検出は、すべての可視および隠れたシート全体で個人データを特定します。名前は仮名に置き換えられ、住所はタイプに適したプレースホルダーに置き換えられ、給与は保持され(PIIではない)、関連する個人識別子は削除されます。匿名化は、数日ではなく数分で50,000行を処理します。
エンティティごとの設定により、異なるデータタイプに対して異なる処理が可能です: 名前は一貫した仮名に置き換えられ(異なるセルの同じ名前は同じ仮名を取得し、分析の有用性を保持)、SSNはマスクされた文字列に置き換えられ、住所は市のみの近似に置き換えられ、個人のメールアドレスは役割ベースのプレースホルダーに置き換えられます。
出典: