블로그로 돌아가기법률 기술

GDPR와 엑셀 파일: 스프레드시트 익명화가 문서 수정과 다른 이유

엑셀 수식은 고객 이름이 포함된 셀을 참조합니다. 피벗 테이블은 민감한 데이터를 캐시합니다. 67%의 정부 및 방위 조달 RFP에는 공기 차단 환경이 필요합니다 (DISA 2024). 스프레드시트 익명화는 텍스트 교체가 아닌 셀 수준의 지능이 필요합니다.

April 10, 20268 분 읽기
Excel anonymizationspreadsheet GDPRpivot table redactioncell-level PII detectionformula preservation

스프레드시트가 문서가 아닌 이유

워드 문서는 서식 메타데이터가 포함된 순차적 텍스트 스트림입니다. 엑셀 스프레드시트는 관계형 데이터 구조입니다: 셀은 다른 셀을 참조하고, 수식은 셀 범위에서 작동하며, 피벗 테이블은 명명된 데이터 범위를 집계하고, 매크로는 스프레드시트 객체 모델을 탐색합니다. 엑셀 파일을 PII 패턴을 처리하기 위한 텍스트 문서로 취급하는 것은 — 대부분의 문서 수정 도구가 스프레드시트에 접근하는 방식 — 스프레드시트의 실제 내용을 정의하는 데이터 관계를 놓치는 것입니다.

고객 분석 스프레드시트를 고려해 보십시오. A열에는 고객 이름이 포함되어 있습니다. D열에는 수식이 있습니다: =VLOOKUP(A2, CustomerTable, 5, FALSE) — 고객의 이름을 기반으로 고객의 계좌 잔액을 반환하는 조회입니다. 익명화 도구가 A열의 이름을 교체하지만 수식 참조나 조회 테이블을 업데이트하지 않으면, 수식은 원래 이름에 대한 실제 계좌 잔액을 계속 반환합니다. "익명화된" 문서는 데이터 관계를 통해 원래 고객의 신원을 여전히 노출합니다.

이것은 가상의 극단적인 사례가 아닙니다. 기업 엑셀 파일은 데이터 관계를 중심으로 구축됩니다. 관계 구조를 이해하지 않고 개별 셀 값을 익명으로 교체하면, 익명화된 것처럼 보이지만 수식 참조, 피벗 테이블 캐시 및 시트 간 조회를 통해 원래 데이터를 유지하는 문서가 생성됩니다.

GDPR 제3자 공유 요구 사항

GDPR 제28조는 프로세서와의 데이터 공유를 규율합니다: 개인 데이터를 외부 당사자(컨설턴트, 분석 공급업체, 감사인)와 공유하는 조직은 적절한 기술적 안전 장치를 보장해야 합니다. 실질적인 질문: 외부 분석 공급업체와 50,000개의 고객 기록이 포함된 엑셀 데이터 세트를 공유할 때 적절한 안전 장치는 무엇입니까?

PDF 내보내기는 수식을 제거하고 스냅샷을 생성합니다 — 그러나 대형 엑셀 파일의 PDF 내보내기는 복잡한 서식을 자주 손상시키며 분석 용도로 적합하지 않습니다. CSV로 변환하면 수식, 피벗 테이블 및 대부분의 분석 구조가 제거됩니다. 두 옵션 모두 외부 공급업체가 분석 목적으로 사용할 수 있는 데이터 세트를 제공하지 않습니다.

네이티브 엑셀 형식 내에서의 셀 수준 익명화 — 분석 구조를 유지하면서 식별 값을 교체하는 것 — 는 GDPR 안전 장치 요구 사항과 비즈니스 유용성 요구 사항을 동시에 충족하는 유일한 접근 방식입니다.

방위 스프레드시트를 위한 공기 차단 처리

67%의 정부 및 방위 조달 RFP는 공기 차단 환경 요구 사항을 언급합니다 (DISA 2024). 인사 데이터, 물류 정보 또는 엑셀 형식의 조달 기록을 다루는 방위 계약자는 클라우드 기반 익명화 도구를 사용할 수 없습니다. 이는 클라우드 기반 문서 처리와 같은 이유로 데이터가 통제된 네트워크를 떠날 수 없기 때문입니다.

엑셀 전용 익명화 기능과 로컬 전용 처리를 결합하면 정부 계약 준수를 위한 기술 프로필이 생성됩니다. 데스크탑 앱은 처리 중 네트워크 호출 없이 엑셀 파일을 로컬에서 처리합니다; 익명화 결과는 공기 차단 환경을 떠나지 않으며; 처리된 파일은 통제된 네트워크 내에서 내부 공유를 위해 사용 가능합니다.

셀 수준의 지능

효과적인 엑셀 익명화는 동시에 세 가지 수준에서 작동합니다:

값 수준: 개별 셀에서 PII 값을 감지하고 교체합니다. 고객 이름, 이메일 주소, 전화번호 및 국가 ID 번호는 문서 처리에 사용되는 동일한 하이브리드 감지 엔진을 통해 식별됩니다.

수식 수준: PII가 포함된 셀을 참조하는 수식이 있는 셀을 식별하고, 해당 참조를 익명화된 값으로 업데이트하거나 수식을 계산된 결과로 교체하여 수식 기반 PII 노출을 방지합니다.

구조 수준: 피벗 테이블 데이터 캐시를 지우고, 숨겨진 행과 열을 처리하며, 특정 셀 주소나 값을 참조하는 VBA 매크로 코드를 처리합니다.

출처:

데이터 보호를 시작할 준비가 되셨나요?

48개 언어로 285개 이상의 엔티티 유형으로 PII 익명화를 시작하세요.