डेनमार्क CPR नंबर: GDPR अनुपालन गाइड
2026 के लिए अपडेट किया गया
डेनमार्क के डेटा वॉचडॉग, Datatilsynet ने 2024 में 31 GDPR निर्णय जारी किए। चौदह में हेल्थकेयर डेटा शामिल था। यह उच्च हिस्सेदारी दो तथ्यों को दर्शाती है: डेनमार्क एक बड़ी राष्ट्रीय स्वास्थ्य प्रणाली चलाता है, और उस प्रणाली में तकनीकी अंतराल रोगी रिकॉर्ड को उजागर करते रहते हैं।
CPR नंबरों के लिए चेक-डिजिट नियम
CPR नंबर डेनमार्क का व्यक्तिगत ID है। यह DDMMYY-XXXX प्रारूप में 10 अंक है। पहले छह अंक जन्म तिथि हैं। अंतिम चार एक कोड और एक चेक अंक हैं।
चेक अंक मॉड्यूलस-11 नियम का उपयोग करता है:
- अंक 1 से 9 लें।
- प्रत्येक को एक भार दें: 4, 3, 2, 7, 6, 5, 4, 3, 2।
- प्रत्येक अंक को उसके भार से गुणा करें। सभी परिणाम जोड़ें।
- 11 से विभाजित करें। शेष नोट करें।
- शेष 0 → चेक अंक 0 है।
- शेष 1 → संख्या वैध नहीं है।
- शेष 2–10 → चेक अंक 11 घटाकर शेष है।
यह नियम किसी भी टूल के लिए महत्वपूर्ण है जो CPR नंबरों के लिए स्कैन करता है। कुछ DDMMYY-XXXX स्ट्रिंग कभी भी वैध नहीं हो सकतीं। जो टूल इस चरण को छोड़ देते हैं वे तारीखों, चालान कोड और संदर्भ नंबरों को वास्तविक ID के रूप में फ्लैग करते हैं।
प्राधिकरण की 2024 समीक्षा में पाया गया कि 67% जेनेरिक NLP टूल इस जांच को छोड़ते हैं। यह अंतराल इसके हेल्थकेयर मामलों में शीर्ष तकनीकी विफलता है।
डेनमार्क के पांच स्वास्थ्य रजिस्ट्री
डेनमार्क पांच राष्ट्रीय रजिस्ट्री में स्वास्थ्य डेटा को लिंक करता है। व्यक्तिगत ID सभी पांच को एक साथ जोड़ता है।
- अस्पताल डिस्चार्ज रिकॉर्ड (1977 से)
- प्रिस्क्रिप्शन डेटा (1995 से)
- कैंसर रजिस्ट्री (1943 से)
- मृत्यु के कारण रजिस्ट्री (1970 से)
- प्राथमिक देखभाल निदान (1990 से)
यह डेनिश स्वास्थ्य अनुसंधान को बहुत मजबूत बनाता है। यह एक जोखिम भी पैदा करता है। कच्ची ID को हटाना पर्याप्त नहीं है। एक डेटासेट जिसमें अभी भी उम्र, लिंग, निदान और वर्ष हैं, लोगों को पुनः उजागर कर सकता है — विशेष रूप से दुर्लभ स्थितियों वाले लोगों को।
Dataitilsynet का माध्यमिक स्वास्थ्य डेटा उपयोग पर 2024 मार्गदर्शन तीन आवश्यकताएं निर्धारित करता है।
लिखें कि आपने डेटा के साथ क्या किया: उन फील्ड को सूचीबद्ध करें जिन्हें आपने हटाया, जिन्हें आपने गोल किया या समूहीकृत किया, और आउटपुट किस समूह आकार को प्राप्त करता है। एक नीति नोट इस मानक को पूरा नहीं करता।
बड़े सेट के लिए बाहरी समीक्षा प्राप्त करें: 5,000 से अधिक लोगों वाले डेटासेट के लिए, प्राधिकरण डी-पहचान चरणों की स्वतंत्र तकनीकी समीक्षा की सिफारिश करता है।
प्रश्न के लिए डेटा का मिलान करें: डेटासेट को बताए गए अनुसंधान लक्ष्य के अनुसार फिट होना चाहिए। प्राधिकरण को ऐसे मामले मिले जहां टीमों ने पूर्ण राष्ट्रीय रजिस्ट्री का उपयोग किया जब एक छोटा नमूना काम कर सकता था।
चेक-डिजिट नियम अन्य यूरोपीय ID प्रारूपों पर कैसे लागू होते हैं, इसके लिए हमारा EU राष्ट्रीय ID डिटेक्शन गाइड देखें।
2024 के मामलों ने क्या पाया
14 हेल्थकेयर मामले तीन सामान्य विफलता प्रकार साझा करते हैं।
अनुसंधान डेटा साझाकरण: एक अस्पताल AI प्रशिक्षण के लिए एक शैक्षणिक भागीदार को एक डी-पहचान रोगी डेटासेट भेजता है। सेट में जन्म तिथि के भाग, निदान कोड और उपचार तिथियां होती हैं। प्राधिकरण को पता चलता है कि यह मिश्रण दुर्लभ बीमारियों वाले रोगियों को पुनः उजागर करता है। असामान्य निदान पूल को तेजी से संकीर्ण करते हैं।
तृतीय-पक्ष AI सेवाएं: एक स्वास्थ्य तकनीक फर्म नैदानिक रिकॉर्ड कार्य के लिए अमेरिकी-आधारित AI सेवा को रोगी नोट्स भेजती है। उन नोट्स में व्यक्तिगत ID पहले हटाई नहीं जाती। कोई वैध ट्रांसफर तंत्र नहीं है।
OCR पाइपलाइन अंतराल: एक बीमाकर्ता विकलांगता दावों के लिए स्कैन किए गए PDF फॉर्म प्रोसेस करता है। उसका OCR टूल छवियों को पाठ में बदलता है। लेकिन यह आउटपुट पर चेक-डिजिट परीक्षण नहीं चलाता। कई ID चूक जाती हैं।
OCR अक्सर बीच में स्पेस डालता है या डैश को शिफ्ट करता है। सरल पैटर्न मिलान उस आउटपुट पर टूट जाता है। डिटेक्शन OCR पाठ पर काम करना चाहिए, न केवल स्वच्छ इनपुट पर। स्कैन किए गए दस्तावेजों को संभालने के चरणों के लिए हमारा OCR हेल्थकेयर डिटेक्शन गाइड देखें।
तीन तकनीकी आवश्यकताएं
ये तीन तत्व डेनिश हेल्थकेयर GDPR अनुपालन के लिए आधार बनाते हैं।
सभी पाठ पर चेक-डिजिट परीक्षण: हर उम्मीदवार स्ट्रिंग पर पूर्ण मॉड्यूलस-11 जांच चलाएं। इसे स्वच्छ पाठ और OCR आउटपुट दोनों पर लागू करें।
डेनिश-भाषा नाम डिटेक्शन: डेनिश पाठ पर प्रशिक्षित एक मॉडल का उपयोग करें। spaCy da_core_news मॉडल एक विकल्प है। एक जेनेरिक अंग्रेजी मॉडल डेनिश नाम और संगठन नाम चूक जाता है।
डी-पहचान रिकॉर्ड: लिखें कि क्या हटाया गया, क्या समूहीकृत किया गया और आउटपुट का समूह आकार। प्राधिकरण इसे तकनीकी रूप में मांगता है, नीति नोट के रूप में नहीं।
हेल्थकेयर डेटा घटनाओं की लागत पर डेटा के लिए हमारा हेल्थकेयर उल्लंघन लागत विश्लेषण देखें।