एक टूल, 45 देश: 260+ इकाइयाँ
वैश्विक प्लेटफ़ॉर्म एक साथ कई देशों से व्यक्तिगत डेटा संसाधित करते हैं। हर देश के अपने ID फ़ॉर्मेट होते हैं। हर फ़ॉर्मेट के अपने नियम होते हैं। एक डिटेक्शन टूल को इन सभी को संभालना होता है। अधिकांश टूल ऐसा नहीं करते।
पहचानकर्ता विखंडन की समस्या
45 देशों में विक्रेताओं वाले एक मार्केटप्लेस को ऑनबोर्डिंग दस्तावेज़ बहुत अलग-अलग मिलते हैं। एक ब्राज़ीलियाई विक्रेता CPF सबमिट करता है। इसमें 11 अंक होते हैं। दो चेक डिजिट होते हैं। वे एक विशिष्ट वेटिंग फ़ॉर्मूला उपयोग करते हैं। एक भारतीय विक्रेता PAN सबमिट करता है। इसमें 10 अक्षर होते हैं। अक्षर और अंक निश्चित स्थानों पर होते हैं। एक जर्मन विक्रेता Steuer-ID सबमिट करता है। इसमें 11 अंक और एक Luhn चेकसम होता है। एक डच विक्रेता BSN सबमिट करता है। इसमें 9 अंक होते हैं और mod-11 सत्यापन का उपयोग होता है।
हर फ़ॉर्मेट की लंबाई और संरचना अलग होती है। एक फ़ॉर्मेट के लिए बनाया गया रेगेक्स दूसरों से मेल नहीं खाएगा। एक व्यापक "10–12 अंक" पैटर्न बहुत ज़्यादा पकड़ता है। यह कीमतें, तारीखें और संदर्भ संख्याएँ भी फ़्लैग करता है। बड़े पैमाने पर गलत-सकारात्मक परिणाम तेज़ी से बढ़ते हैं।
40-पहचानकर्ता का अंतर
अधिकांश एंटरप्राइज़ PII टूल लगभग 40 पहचानकर्ता प्रकारों के साथ आते हैं। सामान्य में शामिल हैं:
- US सोशल सिक्योरिटी नंबर
- US पासपोर्ट फ़ॉर्मेट
- US ड्राइविंग लाइसेंस
- Luhn सत्यापन के साथ जेनेरिक क्रेडिट कार्ड फ़ॉर्मेट
- ईमेल पते
- NANP फ़ॉर्मेट में फ़ोन नंबर
- IP पते
ये उत्तर अमेरिकी अनुपालन को अच्छी तरह से कवर करते हैं। ये वैश्विक संचालन को कवर नहीं करते।
क्षेत्र के अनुसार अंतर कैसा दिखता है
दक्षिण अमेरिका: ब्राज़ीलियाई CPF और CNPJ ब्राज़ील के राजकोषीय प्राधिकरण के चेकसम एल्गोरिदम का उपयोग करते हैं। अर्जेंटीना का CUIT एक अलग भारित-योग सूत्र का उपयोग करता है। कोलंबियाई NIT की अपनी सत्यापन विधि है। इनमें से कोई भी US पैटर्न से मेल नहीं खाता।
एशिया: भारतीय PAN, Aadhaar, GSTIN और Voter ID प्रत्येक का एक अलग फ़ॉर्मेट है। जापानी My Number में 12 अंक हैं। दक्षिण कोरियाई Resident Registration Number और चीनी राष्ट्रीय ID प्रत्येक के लिए अपने पहचानकर्ता की आवश्यकता है।
EU सदस्य राज्य: पूर्ण EU कवरेज के लिए सभी 27 सदस्य राज्यों के IBAN फ़ॉर्मेट की आवश्यकता है। प्रत्येक की देश-विशिष्ट लंबाई और फ़ॉर्मेट है। इसमें प्रत्येक राष्ट्रीय ID फ़ॉर्मेट भी शामिल है। इसमें जर्मन Steuer-ID, फ्रेंच NIR, डच BSN, पोलिश PESEL और स्वीडिश Personnummer शामिल हैं। इसमें स्लोवेनियाई EMŠO, क्रोएशियाई OIB, बल्गेरियाई EGN और रोमानियाई CNP भी शामिल हैं।
260+ इकाई प्रकार क्या कवर करते हैं
260+ इकाई लाइब्रेरी सभी 27 EU सदस्य राज्यों के राष्ट्रीय IDs को कवर करती है। यह सभी EU IBAN फ़ॉर्मेट को सत्यापित करती है। यह दक्षिण अमेरिकी IDs को कवर करती है: ब्राज़ील CPF और CNPJ, अर्जेंटीना CUIT, कोलंबिया NIT। यह एशियाई IDs को कवर करती है: भारत PAN, Aadhaar, GSTIN, जापान My Number, कोरिया RRN। यह UK IDs को कवर करती है: NI Number, NHS Number, NINO वेरिएंट। यह चिकित्सा IDs को कवर करती है: US NPI, DEA नंबर, अस्पताल MRN फ़ॉर्मेट। यह वित्तीय IDs को कवर करती है: SWIFT कोड, BIC फ़ॉर्मेट, खाता संख्या पैटर्न।
डिटेक्शन कवरेज अनुपालन का प्रश्न क्यों है
हर ढाँचे की आवश्यकता है कि उसके पहचानकर्ता मिले और सुरक्षित हों। GDPR EU विक्रेता डेटा को कवर करता है। LGPD ब्राज़ीलियाई विक्रेता डेटा को कवर करता है। भारत का DPDP Act भारतीय विक्रेता डेटा को कवर करता है।
"उचित सुरक्षा" का अर्थ है कि टूल ने पहचानकर्ता खोजा। छूटा हुआ Aadhaar कॉन्फ़िग विफलता नहीं है। यह कवरेज विफलता है। वैश्विक प्लेटफ़ॉर्म के लिए, यह अंतर आंशिक अनुपालन और वास्तविक सुरक्षा के बीच का अंतर है।
260+ इकाई कवरेज के साथ एकल तैनाती इन सभी न्यायालयों को संभालती है। कोई अलग क्षेत्रीय टूल नहीं। कोई अलग प्रसंस्करण पाइपलाइन नहीं। उन फ़ॉर्मेट के लिए कोई मैन्युअल संवर्द्धन नहीं जो 40-पहचानकर्ता टूल चूक जाता है।
GDPR दायित्वों के साथ कवरेज कैसे मैप होती है, इसके विवरण के लिए देखें GDPR अनुपालन संसाधन। ऑडिट ट्रेल और अपडेट नीतियों के लिए देखें सुरक्षा और अनुपालन विवरण।