하나의 도구, 45개국: 260개 이상의 엔티티
글로벌 플랫폼은 동시에 많은 국가의 개인 데이터를 처리합니다. 각 국가에는 자체 ID 형식이 있습니다. 각 형식에는 자체 규칙이 있습니다. 단일 탐지 도구가 이 모두를 처리해야 합니다. 대부분의 도구는 그렇지 않습니다.
식별자 단편화 문제
45개국에 판매자가 있는 마켓플레이스는 매우 다른 온보딩 문서를 받습니다. 브라질 판매자는 CPF를 제출합니다. 11자리. 두 자리가 체크 자리입니다. 특정 가중치 공식을 사용합니다. 인도 판매자는 PAN을 제출합니다. 10자리. 글자와 숫자가 고정 위치에 나타납니다. 독일 판매자는 Steuer-ID를 제출합니다. 11자리와 루한 체크섬. 네덜란드 판매자는 BSN을 제출합니다. mod-11 검증을 사용하는 9자리.
각 형식은 다른 길이와 구조를 가집니다. 한 형식을 위해 구축된 정규식은 다른 것과 일치하지 않습니다. 광범위한 "10~12자리" 패턴은 너무 많이 잡습니다. 가격, 날짜, 참조 번호를 표시합니다. 거짓 양성이 규모에서 빠르게 증가합니다.
40개 식별자 격차
대부분의 기업 PII 도구는 약 40개의 식별자 유형을 제공합니다:
- 미국 주민번호
- 미국 여권 형식
- 미국 운전면허증
- 루한 검증을 포함한 일반 신용카드 형식
- 이메일 주소
- NANP 형식의 전화번호
- IP 주소
이것들은 북미 컴플라이언스를 잘 다룹니다. 글로벌 운영은 다루지 않습니다.
지역별 격차
남미: 브라질 CPF와 CNPJ는 브라질 세무 기관의 체크섬 알고리즘을 사용합니다. 아르헨티나 CUIT는 다른 가중합 공식을 사용합니다. 콜롬비아 NIT는 자체 검증 방법이 있습니다.
아시아: 인도 PAN, Aadhaar, GSTIN, 유권자 ID는 각각 다른 형식을 가집니다. 일본 My Number는 12자리입니다. 한국 주민등록번호와 중국 국가 ID는 각각 자체 인식기가 필요합니다.
EU 회원국: 전체 EU 커버리지에는 27개 회원국 모두의 IBAN 형식이 필요합니다. 각각 국가별 길이와 형식이 있습니다. 또한 각 국가 ID 형식이 필요합니다: 독일 Steuer-ID, 프랑스 NIR, 네덜란드 BSN, 폴란드 PESEL, 스웨덴 Personnummer, 슬로베니아 EMŠO, 크로아티아 OIB, 불가리아 EGN, 루마니아 CNP.
260개 이상 엔티티 유형이 다루는 것
260개 이상의 엔티티 라이브러리는 다음을 포함합니다:
- 27개 EU 회원국 국가 ID 전체
- 모든 EU IBAN 형식
- 남미 ID: 브라질 CPF/CNPJ, 아르헨티나 CUIT, 콜롬비아 NIT
- 아시아 ID: 인도 PAN, Aadhaar, GSTIN, 일본 My Number, 한국 RRN
- 영국 ID: NI 번호, NHS 번호, NINO 변형
- 의료 ID: 미국 NPI, DEA 번호, 병원 MRN 형식
- 금융 ID: SWIFT 코드, BIC 형식, 계좌번호 패턴
탐지 커버리지가 컴플라이언스 질문인 이유
각 프레임워크는 해당 식별자를 찾고 보호할 것을 요구합니다. GDPR은 EU 판매자 데이터를 다룹니다. LGPD는 브라질 판매자 데이터를 다룹니다. 인도의 DPDP Act는 인도 판매자 데이터를 다룹니다.
"적절한 보호"는 도구가 식별자를 찾았다는 것을 의미합니다. 놓친 Aadhaar는 구성 실패가 아닙니다. 커버리지 실패입니다.
260개 이상의 엔티티 커버리지를 가진 단일 배포가 이 모든 관할권을 처리합니다. 별도의 지역별 도구가 없습니다. 별도의 처리 파이프라인이 없습니다.
GDPR 의무에 대한 커버리지 매핑은 GDPR 컴플라이언스 리소스를 참조하세요.