Masalah Fragmentasi Pengidentifikasi Global
Platform pasar dengan penjual di 45 negara memproses dokumen onboarding yang terlihat sepenuhnya berbeda tergantung di mana penjual asli. Penjual Brazil mengirimkan CPF (Cadastro de Pessoas Físicas)—11-digit ID pajak dengan dua digit cek yang dihitung menggunakan algoritma penimbangan tertentu. Penjual India memberikan PAN (Nomor Akun Permanen)—format alfanumerik 10-karakter menggabungkan huruf dan digit dalam pola posisional tertentu. Penjual Jerman memberikan Steuer-ID (11-digit dengan checksum Luhn). Penjual Belanda memberikan BSN (Burger Service Nummer, 9 digit dengan validasi mod-11).
Setiap format memiliki panjang berbeda, struktur, dan algoritma validasi. Satu regex dirancang untuk satu format tidak cocok dengan yang lain. Pola "10-12 string numerik digit" generik menghasilkan tingkat positif palsu yang tidak dapat dilarang di seluruh dokumen keuangan berisi harga, kuantitas, tanggal, dan nomor referensi.
Kewajiban kepatuhan tidak membedakan menurut negara. GDPR mencakup data penjual EU. LGPD mencakup data penjual Brazil. DPDP Act mencakup data penjual India. Setiap kerangka regulasi memerlukan perlindungan yang sesuai dengan data pribadi yang dicakup oleh kerangka itu—dan "sesuai" berarti pengidentifikasi dideteksi dan dilindungi, bukan hanya upaya deteksi dibuat.
Kesenjangan Pengidentifikasi 40
Sebagian besar alat deteksi PII perusahaan mengirim dengan pengenali untuk kira-kira 40 komun...