미국 중심의 PII 도구 문제
대부분의 PII 탐지 도구는 미국 데이터 형식을 위해 미국에서 제작되었습니다. 사회 보장 번호 — AAA-BB-CCCC 형식의 9자리 숫자, 문서화된 지역 번호, 그룹 번호 및 일련 번호 — 는 주요 설계 목표였습니다. SSN 탐지에 기반한 도구는 SSN을 신뢰성 있게 탐지합니다. 이들은 또한 전화번호, 이메일 주소 및 미국 운전 면허 형식을 탐지할 수 있습니다. 그러나 이들은 다른 모든 국가에서 사용되는 식별자 형식을 체계적으로 놓칩니다.
GDPR은 미국 중심성을 준수 면제로 인정하지 않습니다. 독일 Steuer-ID (Steuerliche Identifikationsnummer)는 Bundeszentralamt für Steuern에서 발급한 11자리 세금 식별 번호로, 특정 체크섬 알고리즘이 체크섬 숫자에 대해 검증됩니다. 이는 독일 거주자를 SSN이 미국인을 식별하는 것만큼 개인적으로 식별합니다. GDPR 제4조는 개인 데이터를 "식별되거나 식별 가능한 자연인과 관련된 모든 정보"로 정의합니다 — Steuer-ID는 귀하의 PII 도구가 형식을 알고 있는지 여부와 관계없이 GDPR에 따라 개인 데이터입니다.
GDPR 벌금은 EU 거주자의 데이터를 처리하는 데이터 시스템에서 EU 국가별 PII 노출에 대해 부과되었습니다. 준수 격차는 이론적이지 않으며, 집행 조치를 초래했습니다.
유럽 식별자 환경
유럽 식별자 커버리지 격차의 규모:
독일: Steuer-ID (11자리, 체크섬), Sozialversicherungsnummer (12자리, 구조적 형식), Reisepass (특정 발급 기관 코드가 포함된 10자리 여권)
프랑스: NIR/Numero de Securite Sociale (성별 [1], 출생 연도 [2], 출생 월 [2], 부서 [2], 지방 [3], 등록 번호 [3], 체크 키 [2]를 인코딩한 15자리), Carte Vitale (15자리 NIR 카드), SIRET (14자리 사업 식별자), SIREN (9자리)
스웨덴: Personnummer (10자리, YYMMDD-XXXX 형식, 마지막 두 자리가 이전 숫자에서 출생 카운티를 식별), Samordningsnummer (비거주자를 위한 조정 번호, 유사한 형식으로 일 + 60)
노르웨이: Fodselsnummer (11자리, DDMMYYNNNKK 형식, 중간 숫자에 성별 포함), D-nummer (조정 번호, 일 + 40)
브라질: CPF (Cadastro de Pessoas Fisicas, 11자리와 두 개의 체크 숫자), CNPJ (14자리 사업 식별자)
인도: Aadhaar (12자리 생체 인식 신원, Verhoeff 알고리즘 체크 숫자 포함), PAN (소득세를 위한 10자 알파벳 숫자)
UAE: Emirates ID (15자리: 784-출생 연도-순서-체크)
12개국의 직원 급여 데이터를 처리하는 글로벌 HR 관리자는 12개국의 국가 ID 형식을 한 번에 탐지할 수 있는 도구가 필요합니다 — 12개의 개별 국가별 도구를 구성하거나 12개의 개별 정규 표현식 라이브러리를 유지 관리하지 않고도.
285개 이상의 엔티티 유형 아키텍처
285개 이상의 엔티티 유형 라이브러리는 전체 EU 회원국 식별자 세트, 주요 APAC 식별자 (Aadhaar, PAN, CPF, CNPJ, Emirates ID, 태국 시민 ID) 및 미국 식별자 (SSN, EIN, 주별 운전 면허)를 단일 탐지 엔진에서 다룹니다. 이 라이브러리는 국가별 형식이 발전함에 따라 유지 관리되고 업데이트됩니다.
출처: