ExcelにおけるGDPRコンプライアンスの盲点
PDFの墨消しツールはExcelファイルには対応していません。これがコンプライアンス上の盲点を生み出します。企業環境では、HR・財務・オペレーションのほぼすべてのチームが影響を受けます。
GDPRに基づくアクセス要求は2021年から2024年にかけて180%増加しました(EDPBの年次報告書)。DSARが届いたとき、要求者の個人データを提供しなければなりません。同じファイル内の他の全員のデータも保護する必要があります。特定の行をエクスポートするだけでは不十分です。他のレコードは引き続き見える状態です。適切なDSAR対応には、要求者以外のすべてのデータの匿名化が必要です。
DSARの手動処理には平均12時間かかります。月に200件のDSARを処理すると、2,400時間の工数になります。手動処理ではスケールしません。
Excel匿名化がカバーすべき範囲
スプレッドシートには、テキストツールでは対応できない問題があります。
非表示の行と列。 Excelファイルには非表示の行や列が含まれることがよくあります。これらには下書きデータや元の値が含まれている場合があります。表示されているセルのみを読み取るツールは、非表示エリアの個人データを見落とします。
数式の参照。 あるセルが他のセルを参照して計算された値を表示している場合があります。元のセルを消去しても数式の出力は更新されません。元の個人データが数式の結果に残り続けます。
ピボットテーブルのキャッシュ。 Excelのピボットテーブルはソースデータのコピーを保存します。ソートシートを消去してもキャッシュは消えません。ファイルにアクセスできる誰でもキャッシュされたデータを読み取ることができます。
シート間のリンク。 シート1の名前がシート3の数式に使われている場合があります。シート1を消去してシート3を更新しないと、数式から元の値が漏れる可能性があります。
コンプライアンス対応ツールは、非表示のシートを含むすべてのシートを処理し、すべての数式参照を更新する必要があります。
HRユースケース:5万件の従業員データの共有
あるドイツのメーカーが、外部のコンサルタントに5万件の従業員データを共有する必要があります。GDPR第28条は、処理者にデータを共有する際に技術的な管理措置を要求します。ファイルには37列があります:氏名、住所、給与、評価、医療データです。
コンプライアンスの期限内に5万行を手動で匿名化することは不可能です。
WordおよびExcelアドインはMicrosoft Excel内で直接動作します。エクスポートは不要です。個人データの検出は、表示・非表示のすべてのシートで実行されます。名前は一貫した仮名になります。2つのセルに同じ名前があれば同じトークンを取得します。分析上のリンクは維持されます。住所は適切なプレースホルダーに置き換えられます。給与はそのまま残ります。5万行全体が数分で処理されます。
エンティティタイプごとのルール設定により、データ種別ごとに異なる処理が可能です。社会保障番号はマスクされます。住所は市区町村レベルに縮小されます。個人のメールアドレスはロールベースのプレースホルダーになります。
この課題はExcelに限りません。すべてのファイル形式には固有の問題点があります。フォーマットの断片化が個人データ検出に与える影響をご覧ください。
一度の処理で3つのGDPRルールを満たす
スプレッドシートの匿名化で第5条の3つの義務を同時に満たすことができます。
データの最小化(第5条(1)(c))。 受信者が必要とする列のみが共有されます。識別可能な列は消去されます。
保存期間の制限(第5条(1)(e))。 元のファイルは法定保存期間のために保持されます。クリーンなコピーは、より短い保存期間で共有されます。
完全性と機密性(第5条(1)(f))。 識別可能なデータはコントロールゾーンの外に出ません。クリーンなコピーのみが送付されます。
各処理実行の監査ログは、第5条(2)に基づく説明責任の記録でもあります。各ファイルおよび各セルにどのルールが適用されたかが示されます。
大量のDSARを厳しい期限内に処理するチームには、大規模なGDPR DSARバッチ処理をご覧ください。