ÚOOÚ और Rodné Číslo: GDPR के तहत लिंग एन्कोडिंग
2026 के लिए अपडेट किया गया
चेक डेटा निकाय ÚOOÚ है। पूरा नाम: Úřad pro ochranu osobních údajů। इसने 2024 में 58 फैसले जारी किए। एक निष्कर्ष कई मामलों में दिखाई देता है। rodné číslo (जन्म संख्या) का पता लगाए बिना प्रोसेस किया गया। उपयोग किया गया PII टूल जर्मन या अंग्रेजी के लिए बनाया गया था। इस पहचानकर्ता के लिए उसमें कोई तर्क नहीं था। ÚOOÚ स्पष्ट है: टूल को चेकसम सत्यापन और सही लिंग-ऑफसेट हैंडलिंग के साथ rodné číslo का पता लगाना होगा।
Rodné Číslo: संरचना द्वारा विशेष श्रेणी डेटा
Rodné číslo, या RČ, प्रारूप RRMMDD/XXXX का उपयोग करता है।
- RR — जन्म वर्ष के अंतिम दो अंक।
- MM — जन्म महीना। महिलाओं के लिए, 50 जोड़ा जाता है। महीना 01 51 बन जाता है। महीना 12 62 बन जाता है।
- DD — जन्म का दिन।
- XXXX — 3–4 अंकों का एक छोटा अनुक्रम और एक चेक मूल्य (मॉड्यूलस 11)।
महिलाओं का माह ऑफसेट इस संख्या को जैविक लिंग का एक मार्कर बनाता है। वह ऑफसेट आकस्मिक नहीं है। नागरिक पंजीकरण प्रणाली इसे प्रशासन खोज के लिए उपयोग करती है। GDPR Article 9 उस डेटा को कवर करता है जो व्यक्तिगत लक्षण प्रकट करता है। लिंग उनमें से एक है। ÚOOÚ का दृष्टिकोण: rodné číslo वाला कोई भी दस्तावेज विशेष-श्रेणी-सदृश डेटा रखता है। मजबूत सुरक्षा लागू होती है।
चेक मूल्य कैसे काम करता है: 10-अक्षर संख्याओं के लिए (1954 के बाद जारी), पूर्ण 9-अक्षर आधार 11 से समान रूप से विभाज्य होना चाहिए। 9-अक्षर संख्याओं के लिए (1954 से पहले जारी), कोई चेक मूल्य नहीं है। टूल को दोनों को संभालना होगा।
ÚOOÚ पर्याप्त डिटेक्शन क्या कहता है
PII टूल के लिए ÚOOÚ का 2024 तकनीकी मार्गदर्शन तीन आवश्यकताएं निर्धारित करता है।
लिंग-ऑफसेट हैंडलिंग: माह मूल्य 51–62 वाली संख्याएं महिलाओं के लिए वैध पहचानकर्ता हैं। एक टूल जो उन्हें अमान्य तिथियों के रूप में मानता है वह वयस्क महिला आबादी के प्राथमिक ID के लगभग आधे को चूक जाता है।
प्रारूप वेरिएंट: 1954 से पहले के जन्म 9-अक्षर संख्याएं देते हैं जिनमें कोई चेक मूल्य नहीं है। 1954 के बाद के जन्म एक के साथ 10-अक्षर संख्याएं देते हैं। दोनों समर्थित होने चाहिए।
संदर्भ संकेत: मूल-भाषा दस्तावेजों में, पहचानकर्ता "Rodné číslo:", "RČ:", या "r.č.:" जैसे लेबल के पास दिखाई देता है। भाषा-जागरूक NER मुक्त-रूप पाठ में भी इन संकेतों को खोजने में मदद करती है।
जर्मन मूल कंपनी की समस्या
देश में 67% फर्म जर्मन या अंग्रेजी-कॉन्फ़िगर PII टूल तैनात करती हैं। ÚOOÚ ने यह एक सर्वेक्षण में पाया। विनिर्माण में विफलता श्रृंखला अनुमानित है।
एक जर्मन मूल एक स्कैनिंग टूल तैनात करता है। यह जर्मन पहचानकर्ताओं के लिए सेट अप है। HR डेटा — अनुबंध, स्वास्थ्य रिकॉर्ड, पेरोल — में जन्म संख्याएं होती हैं। टूल में इस पहचानकर्ता प्रकार के लिए कोई तर्क नहीं है। हर जन्म संख्या चूक जाती है। कर्मचारी स्वास्थ्य और वेतन डेटा बिना उन नियंत्रणों के चलता है जिनकी ÚOOÚ को आवश्यकता है। ऑडिट या उल्लंघन में, स्थानीय फर्म GDPR Article 32 के तहत "उचित तकनीकी उपाय" नहीं दिखा सकती।
ÚOOÚ स्थानीय नियंत्रक को जिम्मेदार ठहराता है। "हमारी मूल कंपनी ने टूल चुना" एक वैध बचाव नहीं है। GDPR का जवाबदेही नियम इसकी अनुमति नहीं देता।
विनिर्माण फर्मों के लिए अनुपालन चेकलिस्ट
ये नियंत्रण जर्मन मूल कंपनी टूलिंग वाली औद्योगिक फर्मों पर लागू होते हैं।
- जन्म संख्या डिटेक्शन: 9-अक्षर और 10-अक्षर दोनों प्रारूप। लिंग-ऑफसेट माह हैंडलिंग (50+)। 10-अक्षर वेरिएंट के लिए मॉड्यूलस-11 चेक मूल्य।
- मूल-भाषा NER: spaCy
cs_core_newsया समकक्ष मॉडल। जेनेरिक टूल इस भाषा के लिए 23% कम NER सटीकता दिखाते हैं। स्थानीय मॉडल अंतर को बंद करते हैं। - Číslo OP डिटेक्शन: občanský průkaz (राष्ट्रीय ID कार्ड) एक 9-अक्षर संख्या है। यह कई दस्तावेज प्रकारों में जन्म संख्या के साथ दिखाई देती है।
- IČO और DIČ: व्यावसायिक ID और कर संख्याएं अनुबंधों में दिखाई देती हैं। दोनों को कवरेज की आवश्यकता है।
- बहु-भाषा पाइपलाइन: मिश्रित वातावरण में स्थानीय भाषा, जर्मन और अंग्रेजी में दस्तावेज होते हैं। एकल-भाषा पाइपलाइन क्रॉस-भाषा सह-घटना को चूक जाती है।
ÚOOÚ प्रवर्तन सुसंगत है। जो फर्म ऑडिट में तकनीकी साक्ष्य दिखाती हैं उन्हें बहुत कम जुर्माना का सामना करना पड़ता है। जो नहीं दिखा सकतीं उन्हें अधिक एक्सपोजर का सामना करना पड़ता है।
राष्ट्रीय ID GDPR एक्सपोजर कैसे पैदा करती हैं, इसके व्यापक दृष्टिकोण के लिए हमारा EU राष्ट्रीय कर ID डिटेक्शन गाइड देखें।
इसी तरह के नॉर्डिक पहचानकर्ता के लिए हमारा Datatilsynet CPR तकनीकी गाइड देखें।