스프레드시트 준수 격차
PDF 편집 도구는 Excel 스프레드시트를 처리하지 않습니다. 이 단일 사실은 개인 데이터를 Excel 형식으로 저장하는 조직에 대해 체계적인 준수 격차를 만듭니다 — 이는 기업 환경에서는 거의 모든 HR 부서, 재무 팀 및 운영 부서를 의미합니다.
EDPB의 연례 보고서 데이터에 따르면 GDPR 접근 권한 요청이 2021년부터 2024년까지 180% 증가했습니다. DSAR을 받는 조직은 요청자의 개인 데이터를 휴대 가능한 형식으로 제공해야 하며, 동일 데이터 세트에 포함된 제3자 데이터를 적절히 보호해야 합니다. Excel에 저장된 직원 데이터 세트의 경우, 표준 응답인 특정 행을 내보내는 것은 여전히 동일 파일 내의 다른 직원 데이터를 노출합니다. 적절한 DSAR 준수는 요청자가 아닌 데이터의 개별 기록 익명화를 요구합니다.
평균 DSAR 처리 시간은 수동으로 12시간입니다. 월 200개의 DSAR을 받는 조직 — 중간 규모 회사에겐 적당한 양 — 에겐 이는 매달 2,400명의 직원 시간을 준수 오버헤드로 나타냅니다. 수동 접근 방식은 EDPB 데이터가 이십 년대 나머지 기간 동안 예상하는 요청량에 비례하여 확장되지 않습니다.
Excel 익명화가 실제로 요구하는 것
스프레드시트 익명화는 PDF 편집 도구가 처리하도록 설계되지 않은 도전 과제를 제시합니다.
숨겨진 행과 열: Excel 파일은 일반적으로 숨겨진 행(초안 데이터, 필터링된 기록)과 숨겨진 열(중간 계산, 변환 전의 원래 값)을 포함합니다. 보이는 셀만 처리하는 편집 도구는 숨겨진 PII를 그대로 남깁니다. 준수 등급의 Excel 익명화 도구는 숨겨진 시트를 포함하여 모든 시트를 처리해야 합니다.
내장된 수식: PII를 참조하는 다른 셀의 수식을 포함하는 셀은 파생 값을 표시할 수 있지만, 수식 자체는 원래 데이터를 참조합니다. 표시 값을 익명화하면서 수식 참조를 업데이트하지 않으면 원래 PII가 수식을 검사하는 누구에게나 접근 가능하게 됩니다.
피벗 테이블 캐시: Excel 피벗 테이블은 피벗을 생성하는 데 사용되는 기본 데이터를 캐시합니다. 원본 데이터 시트를 익명화한다고 해서 피벗 캐시가 자동으로 지워지지는 않습니다. "익명화된" Excel 파일을 받은 적대적인 사용자는 피벗 캐시를 검사하여 원래 데이터를 복구할 수 있습니다.
시트 간 참조: 기업 Excel 파일은 일반적으로 시트 간 셀 참조를 포함합니다. 직원의 이름이 시트 1에 나타나고 시트 3의 계산에서 참조될 수 있습니다. 시트 1을 익명화하면서 시트 3의 참조를 업데이트하지 않으면 익명화된 데이터에 대한 참조가 남아 수식 검사를 통해 원래 값을 드러낼 수 있습니다.
HR 부서 사용 사례
독일의 한 제조 회사는 벤치마킹 프로젝트를 위해 외부 보상 컨설턴트와 50,000명의 직원 기록을 공유해야 합니다. GDPR 제28조는 프로세서(외부 컨설턴트)와 개인 데이터를 공유할 때 적절한 기술적 통제를 요구합니다. Excel 파일에는 이름, 개인 이메일 주소, 집 주소, 급여, 성과 평가 및 병가 기록을 포함한 37개의 열이 있습니다.
37개의 열에 걸쳐 50,000행을 수동으로 익명화하는 것은 어떤 준수 시간 프레임에서도 실행 가능하지 않습니다. Word 및 Excel 추가 기능은 스프레드시트를 네이티브로 처리합니다 — Microsoft Excel 내에서, 내보내기나 변환 없이. 셀 수준 PII 감지는 모든 보이는 시트와 숨겨진 시트에서 개인 데이터를 식별합니다. 이름은 가명으로 대체되고; 주소는 유형에 적합한 자리 표시자로 대체되며; 급여는 유지됩니다(PII 아님) 반면 관련 개인 식별자는 제거됩니다. 익명화는 50,000행을 며칠이 아닌 몇 분 내에 처리합니다.
개별 엔터티 구성은 서로 다른 데이터 유형에 대해 서로 다른 처리를 허용합니다: 이름은 일관된 가명으로 대체됩니다(다른 셀의 동일한 이름은 동일한 가명을 가져 분석 유용성을 보존합니다); SSN은 마스킹된 문자열로 대체됩니다; 주소는 도시만 포함된 근사치로 대체됩니다; 개인 이메일 주소는 역할 기반 자리 표시자로 대체됩니다.
출처: