Один інструмент, 45 країн: 260+ типів сутностей
Глобальні платформи одночасно обробляють персональні дані з багатьох країн. Кожна країна має власні формати ідентифікаторів. Кожен формат — свої правила. Єдиний інструмент виявлення повинен охоплювати їх усі. Більшість інструментів із цим не справляється.
Проблема фрагментації ідентифікаторів
Маркетплейс із продавцями з 45 країн отримує дуже різні документи при реєстрації. Бразильський продавець подає CPF. Він містить 11 цифр. Дві з них — контрольні. Для їх перевірки використовується специфічна формула з вагами. Індійський продавець подає PAN. Він містить 10 символів. Літери та цифри розміщені на фіксованих позиціях. Німецький продавець подає Steuer-ID. Він містить 11 цифр та контрольну суму Луна. Нідерландський продавець подає BSN. Він містить 9 цифр та перевіряється за модулем 11.
Кожен формат має свою довжину та структуру. Одне регулярне вираження, побудоване для одного формату, не відповідатиме іншим. Широкий шаблон «10–12 цифр» охоплює надто багато. Він позначає ціни, дати та контрольні номери. Кількість хибних спрацювань швидко зростає при великих обсягах.
Прогалина в 40 ідентифікаторів
Більшість корпоративних інструментів для захисту PII поставляються приблизно з 40 типами ідентифікаторів. Серед поширених:
- Номер соціального страхування США
- Формат паспорта США
- Водійські права США
- Стандартні формати кредитних карток із перевіркою за алгоритмом Луна
- Адреси електронної пошти
- Телефонні номери у форматі NANP
- IP-адреси
Це добре покриває вимоги відповідності в Північній Америці. Але не охоплює глобальні операції.
Як виглядає прогалина по регіонах
Південна Америка: Бразильські CPF та CNPJ використовують алгоритми контрольних сум від бразильського фіскального органу. Аргентинський CUIT використовує іншу формулу зваженої суми. Колумбійський NIT має власний метод перевірки. Жодна з них не відповідає американським шаблонам.
Азія: Індійські PAN, Aadhaar, GSTIN та Voter ID — кожен має окремий формат. Японський My Number містить 12 цифр. Реєстраційний номер жителя Південної Кореї та китайський національний ID потребують власних розпізнавачів.
Держави-члени ЄС: Повне покриття ЄС потребує форматів IBAN для всіх 27 держав-членів. Кожна має специфічну для країни довжину та формат. Також потрібен кожен формат національного ID. Серед них: German Steuer-ID, французький NIR, нідерландський BSN, польський PESEL, шведський Personnummer, словенський EMŠO, хорватський OIB, болгарський EGN та румунський CNP.
Що охоплює бібліотека з 260+ типів сутностей
Бібліотека з 260+ типів охоплює національні ID усіх 27 держав-членів ЄС. Вона перевіряє всі формати IBAN ЄС. Охоплює ID Південної Америки: CPF та CNPJ Бразилії, CUIT Аргентини, NIT Колумбії. Охоплює ID Азії: індійські PAN, Aadhaar, GSTIN, японський My Number, корейський RRN. Охоплює британські ID: NI Number, NHS Number, варіанти NINO. Охоплює медичні ID: US NPI, номери DEA, формати MRN лікарень. Охоплює фінансові ID: SWIFT-коди, формати BIC, шаблони номерів рахунків.
Чому покриття виявлення — це питання відповідності
Кожен регуляторний фреймворк вимагає, щоб його ідентифікатори були виявлені та захищені. GDPR охоплює дані продавців ЄС. LGPD охоплює дані бразильських продавців. Індійський закон DPDP охоплює дані індійських продавців.
«Належний захист» означає, що інструмент знайшов ідентифікатор. Пропущений Aadhaar — це не помилка конфігурації. Це помилка покриття. Для глобальних платформ ця прогалина — різниця між частковою та реальною відповідністю.
Одне розгортання з 260+ типами охоплює всі ці юрисдикції. Жодних окремих регіональних інструментів. Жодних окремих конвеєрів обробки. Жодного ручного доповнення для форматів, які пропускає інструмент із 40 розпізнавачами.
Детальніше про те, як покриття співвідноситься із зобов'язаннями GDPR, дивіться у ресурсах з відповідності GDPR. Інформацію про журнал аудиту та політику оновлень дивіться у відомостях про безпеку та відповідність.