Глобални лични данни: SSN, CPF, Aadhaar и още
Проблемът с американскоцентричните инструменти за лични данни
Повечето инструменти за лични данни са създадени в Съединените щати. Те са насочени към американски формати на данни. Номерът за социално осигуряване (SSN) има девет цифри в формат AAA-BB-CCCC. Неговите сегменти за район, група и серия следват документирани правила. Инструментите, ориентирани към САЩ, го разпознават добре. Те разпознават също американски телефонни номера, имейл адреси и шофьорски книжки. Пропускат всеки национален идентификатор, използван извън САЩ.
GDPR не позволява изключение само за САЩ. Вземете германския Steuer-ID. Той е 11-цифрен данъчен идентификатор. Издава се от Bundeszentralamt fur Steuern. Последната цифра е контролна сума. Той идентифицира германски гражданин по същия начин, по който SSN идентифицира американец. GDPR Член 4 обхваща "всяка информация, свързана с идентифицирано или идентифицируемо физическо лице". Steuer-ID отговаря на тази дефиниция. Той е лични данни. Това е вярно независимо дали инструментът ви познава формата.
Глоби по GDPR са последвали излагането на лични данни, специфични за ЕС, в системи, използващи само американски инструменти. Пропастта в съответствието е реална. Санкциите са наложени. Вижте нашия наръчник за съответствие с GDPR за контекст.
Европейският пейзаж на идентификаторите
Пропастта в покритието е голяма. Ето разбивка по държави.
Германия: Steuer-ID — 11 цифри, валидиран с контролна сума. Sozialversicherungsnummer — 12 полета, структуриран. Reisepass — 10 знака с кодове за орган.
Франция: NIR е националният идентификатор за социално осигуряване. Има 15 цифри. Те кодират пол, година на раждане, месец на раждане, департамент, община и контролен ключ. SIRET има 14 цифри. SIREN има девет.
Швеция: Personnummer използва формат YYMMDD-XXXX. Samordningsnummer обхваща лица, неживеещи постоянно в страната. Стойността за ден е изместена с 60.
Норвегия: Fodselsnummer има 11 стойности в формат DDMMYYNNNKK. Полът е кодиран в средната група. D-nummer измества стойността за ден с 40.
Бразилия: CPF — Cadastro de Pessoas Fisicas — има 11 цифри с две контролни стойности. CNPJ е 14-цифреният бизнес идентификатор.
Индия: Aadhaar е 12-цифрен биометричен идентификатор. Използва контрола по Verhoeff. PAN е 10-цифрен данъчен идентификатор с букви и цифри.
ОАЕ: Emirates ID има 15 цифри в формат 784-година на раждане-последователност-контрола.
Глобален HR екип, обхващащ 12 страни, се нуждае от един инструмент. Той трябва да обработва всички 12 национални формата на идентификатори в един проход. Поддържането на отделни regex библиотеки за всяка страна не е практично.
Архитектурата с 285+ типа обекти
Библиотеката с 285+ типа обекти обхваща всички формати на държавите членки на ЕС. Обхваща и основните идентификатори в Азиатско-тихоокеанския регион. Те включват Aadhaar, PAN, CPF, CNPJ, Emirates ID и тайландски граждански идентификатор. Форматите на САЩ — SSN, EIN, шофьорски книжки по щати — също са включени. Един двигател обработва всички. Библиотеката се актуализира при промяна на форматите.
Това е пропастта, която повечето инструменти оставят отворена. Вижте справочника за обекти, за да прегледате какво е обхванато. За ценообразуване на API по обем посетете ценообразуване.