글로벌 PII: SSN, CPF, Aadhaar 등
미국 중심 PII 도구의 문제
대부분의 PII 도구는 미국에서 개발됐습니다. 미국의 데이터 형식을 대상으로 설계됐습니다. 사회보장번호(SSN)는 AAA-BB-CCCC 형식의 9자리 숫자로 구성됩니다. 지역 코드, 그룹 코드, 일련번호 각 부분은 문서화된 규칙을 따릅니다. 미국 중심으로 설계된 도구는 SSN을 잘 감지합니다. 미국 전화번호, 이메일 주소, 운전면허번호도 탐지합니다. 하지만 미국 이외에서 사용하는 국가 ID는 전혀 인식하지 못합니다.
GDPR에는 미국 전용 면제 규정이 없습니다. 독일의 Steuer-ID를 예로 들어보겠습니다. Steuer-ID는 11자리 납세자 식별번호입니다. 독일 연방중앙세무청(Bundeszentralamt für Steuern)이 발급합니다. 마지막 자리는 체크섬입니다. 이 번호는 독일 거주자를 식별하는 방식이 SSN이 미국인을 식별하는 것과 동일합니다. GDPR 제4조는 "식별되었거나 식별 가능한 자연인에 관한 모든 정보"를 다룹니다. Steuer-ID는 이 정의에 해당합니다. 개인 데이터입니다. 사용 중인 도구가 이 형식을 인식하는지 여부와 무관합니다.
미국 전용 도구를 사용하는 시스템에서 EU 특정 PII가 노출되어 GDPR 제재가 부과된 사례가 있습니다. 컴플라이언스 격차는 실재합니다. 이미 집행 조치가 이루어진 바 있습니다. 자세한 내용은 GDPR 컴플라이언스 가이드를 참조하십시오.
유럽 식별자 현황
적용 범위의 격차는 큽니다. 국가별 현황을 살펴보겠습니다.
독일: Steuer-ID — 체크섬 검증이 포함된 11자리. Sozialversicherungsnummer — 12개 필드로 구조화. Reisepass — 기관 코드가 포함된 10자리 문자.
프랑스: NIR은 국가 사회보장 ID입니다. 15자리로 구성되며, 성별, 출생 연도, 출생 월, 도(département), 코뮌, 체크 키를 인코딩합니다. SIRET는 14자리, SIREN은 9자리입니다.
스웨덴: Personnummer는 YYMMDD-XXXX 형식입니다. Samordningsnummer는 비거주자를 위한 번호입니다. 일 값은 60만큼 오프셋됩니다.
노르웨이: Fødselsnummer는 DDMMYYNNNKK 형식의 11자리입니다. 가운데 그룹에 성별이 인코딩됩니다. D-nummer는 일 값을 40만큼 오프셋합니다.
브라질: CPF(Cadastro de Pessoas Físicas)는 두 개의 체크 값을 가진 11자리입니다. CNPJ는 14자리 사업자 ID입니다.
인도: Aadhaar는 Verhoeff 체크를 사용하는 12자리 생체 ID입니다. PAN은 문자와 숫자가 혼합된 10자리 납세자 ID입니다.
UAE: 에미레이트 ID는 784-출생연도-일련번호-체크 형식의 15자리입니다.
12개국을 아우르는 글로벌 HR팀에는 단일 도구가 필요합니다. 한 번의 처리로 12개국 모든 국가 ID 형식을 처리할 수 있어야 합니다. 국가별로 별도의 정규식 라이브러리를 유지하는 방식은 현실적으로 불가능합니다.
285개 이상의 엔터티 유형 아키텍처
285개 이상의 엔터티 유형 라이브러리는 모든 EU 회원국 형식을 포함합니다. 주요 아시아태평양 ID도 지원합니다. Aadhaar, PAN, CPF, CNPJ, 에미레이트 ID, 태국 시민 ID가 여기에 포함됩니다. SSN, EIN, 미국 주별 운전면허번호 등 미국 형식도 물론 포함됩니다. 하나의 엔진으로 모두 처리합니다. 형식이 변경되면 라이브러리도 업데이트됩니다.
이것이 대부분의 도구가 남겨두는 격차입니다. 지원 범위를 확인하려면 엔터티 참조를 검토하십시오. 볼륨별 API 가격은 요금제를 방문하십시오.