Проблемът с фрагментирането на глобалния идентификатор
Пазарна платформа с продавачи в 45 държави обработва документи за включване, които изглеждат напълно различни в зависимост от страната на произход на продавача. Бразилски продавач подава CPF (Cadastro de Pessoas Físicas) — 11-цифрен данъчен номер с две контролни цифри, изчислени с помощта на специфичен алгоритъм за претегляне. Индийски продавач предоставя PAN (постоянен номер на сметка) — буквено-цифров формат от 10 знака, комбиниращ букви и цифри в специфичен позиционен модел. Немски продавач предоставя Steuer-ID (11-цифрен с контролна сума на Luhn). Холандски продавач предоставя BSN (Burger Service Nummer, 9 цифри с валидиране mod-11).
Всеки формат има различна дължина, структура и алгоритъм за валидиране. Един единствен регулярен израз, предназначен за един формат, не съвпада с другите. Общ модел „10-12 цифрен цифров низ“ създава забранителни фалшиви положителни проценти във финансови документи, съдържащи цени, количества, дати и референтни номера.
Задължението за съответствие не се разграничава според държавата. GDPR обхваща данните за продавачите в ЕС. LGPD обхваща данните на бразилския продавач. Законът DPDP обхваща данните на индийския продавач. Всяка регулаторна рамка изисква подходяща защита на личните данни, обхванати от тази рамка — и „подходящо“ означава, че идентификаторът е открит и защитен, а не само че е направен опит за откриване.
Празнината от 40 идентификатора
Повечето корпоративни инструменти за откриване на PII се доставят с разпознаватели за приблизително 40 общи типа идентификатори. Те обикновено включват:
- Номер на социалното осигуряване в САЩ
- Американски паспортен формат
- Шофьорска книжка в САЩ (специфична за държавата)
- Общи формати на кредитни карти (валидиране на Luhn)
- Имейл адреси
- Телефонни номера (формат NANP)
- IP адреси
Инструментите на това ниво на покритие отговарят сравнително добре на изискванията за съответствие на англоговорящите в Северна Америка. Те не покриват ландшафта на идентификаторите на организации, работещи в световен мащаб.
Разликата между 40 идентификатора и глобалното съответствие е значителна:
**Южноамерикански идентификатори: ** Бразилският CPF (физически) и CNPJ (корпоративен) изискват проверка на контролната сума, специфична за формата на бразилския фискален орган. Аржентинският CUIT следва различен алгоритъм за претеглена сума. Колумбийският NIT използва още един метод за валидиране.
Азиатски идентификатори: Индийският PAN, Aadhaar (12-цифрен биометричен ID), индийският GSTIN (GST идентификация) и ID на гласоподавател имат различни формати. Японският My Number (12-цифрен национален ID), южнокорейският резидентен регистрационен номер и китайският национален ID (18 знака с контролна цифра) изискват отделни устройства за разпознаване.
Идентификатори на ЕС: Освен общоприетите формати, цялостното покритие на ЕС изисква формати IBAN за всички 27 държави-членки на ЕС (всяка със специфична за държавата дължина и формат), плюс национални идентификационни формати за всяка държава-членка (немски Steuer-ID, френски NIR, холандски BSN, полски PESEL, шведски Personnummer и други).
Какво всъщност покриват 260+ типа обекти
Изчерпателна библиотека с обекти с 260+ типа обхваща:
- Всички 27 национални идентификатора на държави-членки на ЕС (включително по-малко покрити: словенски EMŠO, хърватски OIB, български EGN, румънски CNP)
- Всички IBAN формати на ЕС (27 специфични за държавата формати с валидиране)
- Основни южноамерикански идентификатори (Бразилия CPF/CNPJ, Аржентина CUIT, Колумбия NIT)
- Основни азиатски идентификатори (Индия PAN/Aadhaar/GSTIN, Япония My Number, Корея RRN)
- Специфични за Обединеното кралство идентификатори след Брекзит (UK NI номер, NHS номер, NINO варианти)
- Медицински идентификатори в различни юрисдикции (US NPI, DEA номера, NHS номера, болнични MRN формати)
- Финансови идентификатори (SWIFT кодове, BIC формати, различни модели на номера на сметки)
За базиран в Лондон пазар, обслужващ продавачи от 45 държави, покритието на 260+ обекта означава, че едно внедряване обработва идентифицирането и защитата на личните данни на продавача във всички юрисдикции – без да се изискват отделни регионални инструменти, отделни канали за обработка или ръчно обогатяване за националните типове идентификатори, които инструментът с 40 разпознавателя пропуска.
Положението за съответствие се променя от „ние защитаваме общите идентификатори“ на „ние защитаваме идентификаторите, присъстващи в нашите действителни данни“. За глобалните операции това разграничение е разликата между частично съответствие и истинска защита.
Източници:
- LGPD Бразилия: изисквания за защита на данните и формати на идентификатори
- [ЕС IBAN формати и валидиране по държави] (https://www.iban.com/structure) – [Закон DPDP на Индия: изисквания за защита на личните данни на Индия] (https://pib.gov.in/PressReleaseIframePage.aspx?PRID=1944321)