1つのツール、45カ国:260以上のエンティティ
グローバルプラットフォームは、多くの国から同時に個人データを処理します。各国には独自のIDフォーマットがあります。各フォーマットには独自のルールがあります。1つの検出ツールがすべてを処理する必要があります。ほとんどのツールはそれができません。
識別子の断片化問題
45カ国にセラーがいるマーケットプレイスは、非常に異なるオンボーディング書類を受け取ります。ブラジル人セラーはCPFを提出します。11桁があります。そのうち2桁はチェックデジットです。特定の重み付け式を使用します。インド人セラーはPANを提出します。10文字あります。文字と数字は固定位置に現れます。ドイツ人セラーはSteuer-IDを提出します。11桁とルーンチェックサムがあります。オランダ人セラーはBSNを提出します。9桁でmod-11検証を使用します。
各フォーマットは長さと構造が異なります。1つのフォーマット用に作られた正規表現は他のフォーマットと一致しません。広い「10〜12桁」のパターンは多くを捕捉しすぎます。価格、日付、参照番号にフラグを立てます。誤検知は大規模で急速に増加します。
40識別子のギャップ
ほとんどのエンタープライズPIIツールは約40の識別子タイプを搭載しています。一般的なものは次のとおりです:
- 米国社会保障番号
- 米国パスポート形式
- 米国運転免許証
- Luhn検証を使用した汎用クレジットカード形式
- メールアドレス
- NANP形式の電話番号
- IPアドレス
これらは北米のコンプライアンスをカバーします。グローバルな運用はカバーしません。
地域別のギャップ
南米: ブラジルのCPFとCNPJはブラジルの税務当局のチェックサムアルゴリズムを使用します。アルゼンチンのCUITは異なる加重和式を使用します。コロンビアのNITには独自の検証方法があります。これらはいずれも米国のパターンとは一致しません。
アジア: インドのPAN、Aadhaar、GSTIN、選挙人IDはそれぞれ独自の形式を持ちます。日本のマイナンバーは12桁です。韓国の住民登録番号と中国の国民ID証は、それぞれ独自の認識モジュールが必要です。
EU加盟国: 完全なEUカバレッジには、27の加盟国すべてのIBANフォーマットが必要です。各国には国固有の長さと形式があります。各国の国民IDフォーマットも必要です。これにはドイツのSteuer-ID、フランスのNIR、オランダのBSN、ポーランドのPESEL、スウェーデンのPersonnummerが含まれます。また、スロベニアのEMŠO、クロアチアのOIB、ブルガリアのEGN、ルーマニアのCNPも含まれます。
260以上のエンティティタイプがカバーするもの
260以上のエンティティライブラリは、27のEU加盟国すべての国民IDをカバーします。すべてのEU IBANフォーマットを検証します。南米のIDをカバーします:ブラジルのCPFとCNPJ、アルゼンチンのCUIT、コロンビアのNIT。アジアのIDをカバーします:インドのPAN、Aadhaar、GSTIN、日本のマイナンバー、韓国のRRN。英国のIDをカバーします:NI番号、NHS番号、NINOの変種。医療IDをカバーします:米国NPI、DEA番号、病院MRN形式。金融IDをカバーします:SWIFTコード、BIC形式、口座番号パターン。
検出カバレッジがコンプライアンス問題である理由
各規制フレームワークは、その識別子が発見され保護されることを要求します。GDPRはEUセラーのデータをカバーします。LGPDはブラジルのセラーのデータをカバーします。インドのDPDP法はインドのセラーのデータをカバーします。
「適切な保護」とは、ツールが識別子を発見したことを意味します。見逃されたAadhaarは設定の失敗ではありません。それはカバレッジの失敗です。グローバルプラットフォームにとって、そのギャップは部分的なコンプライアンスと本当の保護の違いです。
260以上のエンティティカバレッジを持つ単一のデプロイメントで、これらすべての法域を処理します。別々の地域ツールは不要です。別々の処理パイプラインも不要です。40の認識ツールが見逃すフォーマットへの手動エンリッチメントも不要です。
カバレッジがGDPR義務にどのように対応するかの詳細については、GDPRコンプライアンスリソースを参照してください。監査証跡と更新ポリシーについては、セキュリティとコンプライアンスの詳細を参照してください。