LGPD ब्राज़ील: CPF, CNPJ और डेटा संरक्षण
ब्राज़ील की Lei Geral de Proteção de Dados (LGPD) 215 मिलियन लोगों को कवर करती है। यह जनसंख्या के हिसाब से दुनिया का तीसरा सबसे बड़ा डेटा संरक्षण कानून है। यह जर्मनी, फ्रांस और UK को मिलाकर से अधिक लोगों को कवर करती है। Autoridade Nacional de Proteção de Dados (ANPD) ने 2024 में अपने पहले बड़े जुर्माने जारी किए। LGPD के 2020 में लागू होने के बाद की छूट अवधि समाप्त हो गई है।
एक तकनीकी चुनौती भी है। LGPD दस्तावेज़ ब्राज़ीलियन पुर्तगाली में हैं। ब्राज़ील में राष्ट्रीय ID पुर्तगाल के उन लोगों से भिन्न हैं। वे किसी अन्य देश की ID से भी भिन्न हैं।
ब्राज़ीलियन PII क्यों अलग है
ब्राज़ील के संघीय और राज्य ID प्रणाली यूरोपीय डिजिटल पहचान प्रणालियों से अलग हो गए। इसने पहचानकर्ताओं का एक अनूठा सेट बनाया। अधिकांश NLP उपकरण अंग्रेजी या यूरोपीय डेटा पर प्रशिक्षित हैं। वे स्थानीय ID का पता लगाने में विफल रहते हैं।
CPF (Cadastro de Pessoas Físicas): 11-अंकीय करदाता संख्या। प्रारूप: XXX.XXX.XXX-XX। इसके दो चेक अंक हैं। सूत्र दो अलग गणित चरणों का उपयोग करता है। CPF के वैध होने के लिए दोनों मेल खाने चाहिए।
पहचान अंतर बड़ा है। अंग्रेजी-प्रशिक्षित NLP उपकरण CPF को केवल 45% सटीकता के साथ पहचानते हैं (ANPD, 2024)। दो कारण इसे समझाते हैं। पहला, जो उपकरण दो-चरण चेक अंक तर्क के बिना 11-अंकीय संख्याओं का मिलान करते हैं वे वैध CPF संख्याओं को यादृच्छिक अनुक्रमों से भ्रमित करते हैं। दूसरा, CPF कभी-कभी XXX.XXX.XXX-XX प्रारूप के बिना होती है। यह OCR आउटपुट और सादे-पाठ रूपों में होता है।
CNPJ (Cadastro Nacional da Pessoa Jurídica): 14-अंकीय कंपनी ID नंबर। प्रारूप: XX.XXX.XXX/XXXX-XX। इसके भी दो चेक अंक हैं। सूत्र CPF जैसा है लेकिन एक समान नहीं।
RG (Registro Geral): राज्य नागरिक ID कार्ड। प्रारूप राज्य के अनुसार भिन्न होता है। साओ पाउलो 2 अक्षर और 5-9 अंक उपयोग करता है। रियो डी जनेरियो डैश के साथ 7-8 अंक उपयोग करता है। मिनास गेराइस 7-9 अंक उपयोग करता है। अन्य राज्यों के अपने प्रारूप हैं। जो उपकरण केवल एक राज्य का RG जानता है वह अधिकांश RG नंबर चूक जाएगा।
CNH (Carteira Nacional de Habilitação): 11-अंकीय ड्राइविंग लाइसेंस नंबर। इसका एक चेक अंक है। प्रारूप में एक जिला कोड शामिल है।
Título de Eleitor: 12-अंकीय मतदाता ID नंबर। इसके तीन भाग हैं: एक 8-अंकीय ID कोड, एक 2-अंकीय राज्य कोड और 2 चेक अंक।
SUS नंबर (Cartão SUS): 15-अंकीय सार्वजनिक स्वास्थ्य ID। देश का प्रत्येक व्यक्ति एक पाता है। यह सभी अस्पताल और क्लिनिक रिकॉर्ड में दिखाई देता है।
PIS/PASEP: 11-अंकीय सामाजिक कार्यक्रम नंबर। यह प्रत्येक रोजगार रिकॉर्ड में दिखाई देता है।
LGPD अनामीकरण मानक
LGPD अनुच्छेद 12 अज्ञात डेटा को परिभाषित करता है। मानक: डेटा "की पहचान नहीं की जा सकती, प्रसंस्करण के समय उचित तकनीकी साधनों पर विचार करते हुए।" यह एक तकनीक-सापेक्ष मानक है। आज का अज्ञात डेटा वैसा नहीं रह सकता क्योंकि पुनः-ID विधियां सुधरती हैं।
ANPD अधिक मार्गदर्शन देता है। CPF और नाम जैसे प्रत्यक्ष पहचानकर्ताओं को हटाना पर्याप्त नहीं है। अर्ध-पहचानकर्ताओं के समूह अभी भी पुनः-ID की अनुमति दे सकते हैं। आयु सीमा, शहर, लिंग और नौकरी मिलकर किसी व्यक्ति की पहचान कर सकते हैं। इन्हें समूहीकरण या शोर जोड़ने द्वारा संभाला जाना चाहिए।
AI प्रशिक्षण डेटा के लिए, ANPD तीन शर्तों में से एक की आवश्यकता रखता है। पहला: डेटा अनुच्छेद 12 मानक को पूरा करता है। दूसरा: प्रत्येक डेटा विषय ने विशिष्ट प्रशिक्षण उपयोग के लिए स्पष्ट सहमति दी। तीसरा: एक वैध दस्तावेज़ीकृत उद्देश्य है।
पुर्तगाली भाषा आवश्यकताएं
ब्राज़ीलियन पुर्तगाली यूरोपीय पुर्तगाली से भिन्न है। शब्द, वर्तनी और दस्तावेज़ रूप एक समान नहीं हैं। पुर्तगाल पाठ पर प्रशिक्षित NLP मॉडल स्थानीय पाठ पर प्रशिक्षित मॉडल की लगभग 71% सटीकता तक पहुंचते हैं। यह ANPD तकनीकी मूल्यांकन से आता है।
PII पहचान के लिए प्रमुख अंतर:
- नाम: दोहरे-उपनाम उपयोग और नाम क्रम पुर्तगाल से भिन्न हैं।
- पते: CEP कोड प्रारूप XXXXX-XXX का उपयोग करते हैं। यह प्रारूप देश के लिए अद्वितीय है। इसे अपना पहचान तर्क चाहिए।
- दस्तावेज़ शर्तें: यहाँ "Carteira de Identidade" बनाम पुर्तगाल में "Bilhete de Identidade"। एजेंसी के नाम भी भिन्न हैं।
ANPD अनुपालन को क्या चाहिए
चार तकनीकी जरूरतें ANPD अनुपालन को कवर करती हैं। CPF और CNPJ पहचान में दो-चरण चेक अंक सत्यापन शामिल होना चाहिए। RG पहचान को सभी राज्यों को कवर करना होगा। SUS नंबर और Título de Eleitor पहचान भी आवश्यक है। NLP मॉडल को स्थानीय पुर्तगाली पाठ पर प्रशिक्षित होना चाहिए।
देखें हमारी वैश्विक PII पहचानकर्ता पहचान गाइड और 2024 में LGPD प्रवर्तन कार्रवाइयाँ।