Excel과 GDPR 사이의 공백
PDF 편집 도구는 Excel 파일에 작동하지 않습니다. 이 때문에 컴플라이언스 공백이 생깁니다. 기업 환경에서는 인사·재무·운영팀 전반에 영향을 미칩니다.
GDPR 열람권 요청은 2021년부터 2024년까지 180% 증가했습니다(EDPB 연간 보고서). DSAR이 접수되면 요청자의 개인정보를 제공해야 합니다. 동시에 같은 파일에 있는 다른 모든 사람의 정보는 보호해야 합니다. 특정 행만 내보내는 것으로는 부족합니다. 나머지 데이터는 여전히 보입니다. DSAR 컴플라이언스를 제대로 이행하려면 요청자 이외의 모든 데이터를 익명화해야 합니다.
DSAR 처리에 평균 12시간이 소요됩니다. 월 200건이라면 2,400명의 작업 시간이 필요합니다. 수작업으로는 확장이 불가능합니다.
Excel 익명화가 다루어야 할 요소들
스프레드시트에는 일반 텍스트 도구가 처리하지 못하는 문제들이 있습니다.
숨겨진 행과 열. Excel 파일에는 종종 숨겨진 행과 열이 있습니다. 초안 데이터나 원본 값이 들어 있을 수 있습니다. 보이는 셀만 읽는 도구는 숨겨진 영역의 개인정보를 놓칩니다.
수식 참조. 셀이 다른 셀에서 계산된 값을 표시할 수 있습니다. 원본 셀을 지워도 수식 결과가 업데이트되지 않습니다. 원래 개인정보가 수식 결과에 그대로 남습니다.
피벗 테이블 캐시. Excel 피벗 테이블은 원본 데이터의 사본을 저장합니다. 원본 시트를 지워도 캐시는 지워지지 않습니다. 파일을 가진 누구든 캐시된 데이터를 읽을 수 있습니다.
시트 간 연결. 시트 1의 이름이 시트 3의 수식에 등장할 수 있습니다. 시트 3을 업데이트하지 않고 시트 1만 지우면 수식을 통해 원래 값이 노출됩니다.
컴플라이언스 수준의 도구라면 숨겨진 시트를 포함한 모든 시트를 처리하고, 모든 수식 참조를 업데이트해야 합니다.
인사팀 사례: 직원 50,000건 공유
독일의 한 제조업체가 외부 컨설턴트에게 직원 50,000건의 기록을 공유해야 합니다. GDPR 제28조는 처리자와 데이터를 공유할 때 기술적 통제를 요구합니다. 파일에는 37개 열이 있습니다: 이름, 자택 주소, 급여, 평가 점수, 병가 데이터.
50,000행을 수작업으로 익명화하는 것은 어떤 컴플라이언스 일정으로도 불가능합니다.
Word 및 Excel 애드인은 Microsoft Excel 내부에서 작동합니다 — 파일 내보내기가 필요 없습니다. PII 탐지는 보이는 시트와 숨겨진 시트 전체에 걸쳐 실행됩니다. 이름은 일관된 가명으로 처리됩니다. 두 셀에 있는 동일한 이름은 동일한 토큰을 받습니다. 분석적 연결 관계가 유지됩니다. 주소는 유형에 맞는 대체값으로 치환됩니다. 급여는 그대로 유지됩니다. 50,000행 전체가 수분 내에 처리됩니다.
항목별 규칙을 통해 데이터 유형마다 다르게 처리할 수 있습니다. 주민등록번호는 마스킹된 문자열로, 주소는 시·도 수준 값으로, 개인 이메일 주소는 역할 기반 대체값으로 처리됩니다.
이 문제는 Excel에만 해당되지 않습니다. 모든 파일 형식에는 고유한 취약점이 있습니다. 파일 형식별 PII 탐지의 어려움에 대해서는 파일 형식 파편화와 PII 탐지를 참고하세요.
한 번에 충족하는 GDPR 세 가지 원칙
스프레드시트 익명화는 제5조의 세 가지 원칙을 한 번에 충족합니다.
데이터 최소화(제5조 제1항 c호). 수신자에게 필요한 열만 공유됩니다. 식별 열은 제거됩니다.
보존 기간 제한(제5조 제1항 e호). 원본 파일은 법적 보존 기간에 맞게 유지됩니다. 정제된 사본은 더 짧은 보존 기간으로 공유됩니다.
무결성 및 기밀성(제5조 제1항 f호). 식별 데이터는 통제 구역을 벗어나지 않습니다. 정제된 사본만 외부로 나갑니다.
각 처리에서 생성되는 감사 로그는 제5조 제2항의 기록이기도 합니다. 어떤 규칙이 각 파일과 셀에 적용되었는지 보여줍니다.
촉박한 기한 내에 대량 DSAR을 처리하는 팀이라면 GDPR DSAR 대규모 일괄 처리를 참고하세요.