グローバル識別子の断片化問題
45か国に出店しているマーケットプレイスプラットフォームは、出店者の出身国によって全く異なるオンボーディングドキュメントを処理します。ブラジルの出店者はCPF(Cadastro de Pessoas Físicas)を提出します — 特定の重み付けアルゴリズムを使用して計算された2つのチェックディジットを持つ11桁の税IDです。インドの出店者はPAN(Permanent Account Number)を提供します — 特定の位置パターンで文字と数字を組み合わせた10文字の英数字形式です。ドイツの出店者はSteuer-ID(11桁でLuhnチェックサム)を提供します。オランダの出店者はBSN(Burger Service Nummer、9桁でmod-11検証)を提供します。
各形式は異なる長さ、構造、検証アルゴリズムを持っています。1つの形式用に設計された単一のregexは他の形式には一致しません。「10-12桁の数値文字列」という一般的なパターンは、価格、数量、日付、参照番号を含む金融文書において高い偽陽性率を生じます。
コンプライアンスの義務は国によって区別されません。GDPRはEUの出店者のデータをカバーします。LGPDはブラジルの出店者のデータをカバーします。DPDP法はインドの出店者のデータをカバーします。各規制フレームワークは、そのフレームワークによってカバーされる個人データの適切な保護を要求します — そして「適切」とは、識別子が検出され保護されたことを意味し、単に検出の試みが行われたということではありません。
40識別子のギャップ
ほとんどの企業PII検出ツールは、約40種類の一般的な識別子タイプの認識機能を備えています。これには通常、以下が含まれます:
- 米国社会保障番号
- 米国パスポート形式
- 米国運転免許証(州固有)
- 一般的なクレジットカード形式(Luhn検証)
- メールアドレス
- 電話番号(NANP形式)
- IPアドレス
このカバレッジレベルのツールは、英語を話す北米のコンプライアンス要件を合理的に満たします。しかし、グローバルに運営する組織の識別子の風景をカバーしていません。
40の識別子とグローバルコンプライアンスの間のギャップは大きいです:
南米の識別子: ブラジルのCPF(個人)およびCNPJ(法人)は、ブラジルの財務当局形式に特有のチェックサム検証を必要とします。アルゼンチンのCUITは異なる重み付け合計アルゴリズムに従います。コロンビアのNITは別の検証方法を使用します。
アジアの識別子: インドのPAN、Aadhaar(12桁の生体認証ID)、インドのGSTIN(GST識別)、および有権者IDはそれぞれ異なる形式を持っています。日本のマイナンバー(12桁の国民ID)、韓国の住民登録番号、および中国の国民ID(チェックディジット付き18文字)はすべて別々の認識機能を必要とします。
EUの識別子: 一般的に認識されている形式を超えて、包括的なEUカバレッジには、すべての27のEU加盟国のIBAN形式(各国固有の長さと形式)および各加盟国の国民ID形式(ドイツのSteuer-ID、フランスのNIR、オランダのBSN、ポーランドのPESEL、スウェーデンのPersonnummerなど)が必要です。
260以上のエンティティタイプが実際にカバーするもの
260以上のタイプを持つ包括的なエンティティライブラリは以下をカバーします:
- すべての27のEU加盟国の国民識別子(カバーが少ないものも含む:スロベニアのEMŠO、クロアチアのOIB、ブルガリアのEGN、ルーマニアのCNP)
- すべてのEU IBAN形式(27の国固有の形式と検証)
- 主要な南米の識別子(ブラジルのCPF/CNPJ、アルゼンチンのCUIT、コロンビアのNIT)
- 主要なアジアの識別子(インドのPAN/Aadhaar/GSTIN、日本のマイナンバー、韓国のRRN)
- Brexit後のUK特有の識別子(UK NI番号、NHS番号、NINOのバリエーション)
- 管轄区域を超えた医療識別子(米国のNPI、DEA番号、NHS番号、病院のMRN形式)
- 金融識別子(SWIFTコード、BIC形式、さまざまな口座番号パターン)
45か国の出店者にサービスを提供するロンドンベースのマーケットプレイスにとって、260以上のエンティティカバレッジは、単一のデプロイメントですべての管轄区域にわたる出店者の個人データの識別と保護を処理できることを意味します — 別々の地域ツール、別々の処理パイプライン、または40の認識機能ツールが見逃す国民識別子タイプの手動強化を必要としません。
コンプライアンスの姿勢は「一般的な識別子を保護します」から「実際のデータに存在する識別子を保護します」に変わります。グローバルな運営において、その区別は部分的なコンプライアンスと真の保護の違いです。
出典: