अमेरिका-केंद्रित PII टूल समस्या
अधिकांश PII पहचान उपकरण अमेरिका में अमेरिकी डेटा प्रारूपों के लिए बनाए गए थे। सोशल सिक्योरिटी नंबर — AAA-BB-CCCC प्रारूप में 9 अंक, दस्तावेजीकृत क्षेत्र संख्या, समूह संख्या, और अनुक्रम संख्या के साथ — प्राथमिक डिज़ाइन लक्ष्य था। SSN पहचान के चारों ओर बनाए गए उपकरण विश्वसनीय रूप से SSNs का पता लगाते हैं। वे फोन नंबर, ईमेल पते, और अमेरिकी ड्राइवर के लाइसेंस प्रारूपों का भी पता लगा सकते हैं। वे हर अन्य देश में उपयोग किए जाने वाले पहचानकर्ता प्रारूपों को प्रणालीगत रूप से छोड़ देते हैं।
GDPR अमेरिका-केंद्रितता को अनुपालन छूट के रूप में मान्यता नहीं देता। एक जर्मन Steuer-ID (Steuerliche Identifikationsnummer) एक 11-अंक की कर पहचान संख्या है जो Bundeszentralamt für Steuern द्वारा जारी की जाती है, जिसमें एक विशिष्ट चेकसम एल्गोरिदम होता है जो एक चेकसम अंक के खिलाफ मान्य होता है। यह जर्मन निवासियों की पहचान उसी तरह करता है जैसे SSN अमेरिकियों की पहचान करता है। GDPR अनुच्छेद 4 व्यक्तिगत डेटा को "किसी भी जानकारी जो एक पहचाने गए या पहचान योग्य प्राकृतिक व्यक्ति से संबंधित है" के रूप में परिभाषित करता है — एक Steuer-ID GDPR के तहत व्यक्तिगत डेटा है चाहे आपका PII टूल प्रारूप को जानता हो या नहीं।
GDPR जुर्माने EU देश-विशिष्ट PII एक्सपोजर के लिए जारी किए गए हैं उन डेटा सिस्टम में जो EU निवासियों के डेटा को केवल अमेरिकी प्रारूपों के लिए कॉन्फ़िगर किए गए उपकरणों का उपयोग करके संसाधित करते हैं। अनुपालन अंतर कोई सैद्धांतिक नहीं है — इसने प्रवर्तन कार्रवाइयों का उत्पादन किया है।
यूरोपीय पहचानकर्ता परिदृश्य
यूरोपीय पहचानकर्ता कवरेज अंतर का पैमाना:
जर्मनी: Steuer-ID (11-अंक, चेकसम), Sozialversicherungsnummer (12-अंक, संरचनात्मक प्रारूप), Reisepass (विशिष्ट जारी करने वाली प्राधिकरण कोड के साथ 10-अंक का पासपोर्ट)
फ्रांस: NIR/Numero de Securite Sociale (15 अंक लिंग [1], जन्म वर्ष [2], जन्म माह [2], विभाग [2], कम्यून [3], रजिस्ट्रेशन नंबर [3], चेक कुंजी [2]), Carte Vitale (15-अंक का NIR कार्ड), SIRET (14-अंक का व्यवसाय पहचानकर्ता), SIREN (9-अंक)
स्वीडन: Personnummer (10-अंक, प्रारूप YYMMDD-XXXX जिसमें अंतिम दो अंक पुराने नंबरों में जन्म काउंटी की पहचान करते हैं), Samordningsnummer (गैर-निवासियों के लिए समन्वय संख्या, दिन + 60 के समान प्रारूप)
नॉर्वे: Fodselsnummer (11-अंक, प्रारूप DDMMYYNNNKK जिसमें मध्य अंकों में लिंग होता है), D-nummer (समन्वय संख्या, दिन + 40)
ब्राज़ील: CPF (Cadastro de Pessoas Fisicas, 11-अंक जिसमें दो चेक अंक होते हैं), CNPJ (14-अंक का व्यवसाय पहचानकर्ता)
भारत: Aadhaar (12-अंक का बायोमेट्रिक पहचान, Verhoeff एल्गोरिदम चेक अंक के साथ), PAN (आयकर के लिए 10-चरित्र अल्फ़ान्यूमेरिक)
UAE: Emirates ID (15-अंक: 784-बर्थ वर्ष-क्रम-चेक)
एक वैश्विक HR प्रबंधक जो 12 देशों में कर्मचारियों के लिए पेरोल डेटा संसाधित कर रहा है, को एक ऐसे उपकरण की आवश्यकता है जो एकल पास में सभी 12 देशों के राष्ट्रीय ID प्रारूपों का पता लगाए — बिना 12 अलग-अलग देश-विशिष्ट उपकरणों को कॉन्फ़िगर किए या 12 अलग-अलग regex पुस्तकालयों को बनाए रखे।
285+ एंटिटी टाइप आर्किटेक्चर
285+ एंटिटी टाइप पुस्तकालय पूर्ण EU सदस्य राज्य पहचानकर्ता सेट, प्रमुख APAC पहचानकर्ता (Aadhaar, PAN, CPF, CNPJ, Emirates ID, थाई नागरिक ID), और अमेरिकी पहचानकर्ताओं (SSN, EIN, राज्य द्वारा ड्राइवर का लाइसेंस) को एकल पहचान इंजन में कवर करता है। पुस्तकालय को बनाए रखा और अद्यतन किया जाता है जैसे-जैसे देश-विशिष्ट प्रारूप विकसित होते हैं।
स्रोत: