HDPA ग्रीस: AFM और AMKA की पहचान
2026 के लिए अपडेट किया गया
ग्रीस की डेटा संरक्षण प्राधिकरण (HDPA) ने 2024 में 89 प्रवर्तन निर्णय जारी किए। यह 2022 के 34 निर्णयों से 162% अधिक है। पर्यटन क्षेत्र HDPA मामलों में 38% हिस्सेदारी रखता है। समुद्री संचालन अतिरिक्त जोखिम जोड़ता है।
राष्ट्रीय DPA प्रवर्तन के संदर्भ के लिए GDPR अनुपालन मार्गदर्शिका देखें।
AFM: कर पंजीकरण संख्या
AFM एक 9-अंकीय कर संख्या है। प्रत्येक नागरिक, निवासी और व्यवसाय के पास एक होती है।
चेकसम: अंक 1-8 को 256, 128, 64, 32, 16, 8, 4 और 2 के भार से गुणा करें। गुणनफलों का योग करें। modulo 11 लें। यदि परिणाम 10 है, तो संख्या वैध नहीं है। अन्यथा, चेक अंक परिणाम का modulo 10 होता है।
AFM चालान, अनुबंध और सरकारी फॉर्म पर दिखता है। यह देश में लोगों और व्यवसायों दोनों के लिए प्राथमिक ID है।
पहचान की कमी: सामान्य NLP टूल्स AFM को केवल 52% सटीकता से पहचानते हैं (HDPA 2024)। तीन कारण इसे समझाते हैं। पहला: 9-अंकीय प्रारूप कई संदर्भ संख्याओं और दिनांक भागों जैसा दिखता है। दूसरा: दो-चरणीय modulo चेकसम अधिकांश सामान्य टूल्स में नहीं होता। तीसरा: संख्या पर अक्सर कोई लेबल नहीं होता — यह किसी पते के ब्लॉक के अंदर होती है।
संरचित IDs के बारे में अधिक जानकारी के लिए entities संदर्भ देखें।
AMKA: सामाजिक बीमा संख्या
AMKA एक 11-अंकीय संख्या है। अंक 1-6 जन्म तिथि को DDMMYY प्रारूप में एन्कोड करते हैं। अंक 7 लिंग को एन्कोड करता है: विषम पुरुष के लिए, सम महिला के लिए। अंक 8-11 सीरियल नंबर और चेक अंक बनाते हैं।
यह डिज़ाइन स्वीडन के personnummer जैसा है। दोनों एक ही GDPR चिंता उठाते हैं। संख्या जैविक लिंग को एक डेटा बिंदु के रूप में प्रकट करती है।
AMKA स्वास्थ्य रिकॉर्ड, सामाजिक सुरक्षा फाइलों और पेरोल में दिखता है। प्रत्येक नागरिक और निवासी के पास एक है। यह स्वास्थ्य देखभाल और लाभों के लिए मुख्य संख्या के रूप में काम करता है। इस डेटा प्रकार पर GDPR कैसे लागू होता है, यह जानने के लिए सुरक्षा और अनुपालन पृष्ठ देखें।
स्क्रिप्ट समर्थन की कमी
ग्रीक पाठ लैटिन भाषाओं से भिन्न लिपि का उपयोग करता है। यह PII टूल्स के लिए एक मुख्य चुनौती है।
Unicode रेंज: ग्रीक अक्षर U+0370-U+03FF और U+1F00-U+1FFF में होते हैं। केवल ASCII या लैटिन लिपियों के लिए बने टूल्स इन अक्षरों को प्रोसेस नहीं कर पाएंगे।
NER मॉडल: spaCy का el_core_news मॉडल ग्रीक NER संभालता है। लेकिन इसे स्पष्ट सेटअप की आवश्यकता है। अधिकांश डिफ़ॉल्ट पाइपलाइन केवल अंग्रेजी का उपयोग करती हैं। वे ग्रीक-लिपि दस्तावेज़ों पर कोई आउटपुट नहीं देती हैं।
मिश्रित-लिपि फाइलें: देश के दस्तावेज़ अक्सर ग्रीक और लैटिन लिपि दोनों को मिलाते हैं। ब्रांड नाम और तकनीकी शब्द लैटिन में दिखते हैं। मुख्य पाठ ग्रीक में होता है। एक पाइपलाइन को दोनों को संभालना होगा।
केस फॉर्म: नाम ग्रीक वाक्यों में रूप बदलते हैं। एक ग्रीक नाम विषय रूप में genitive में बदल जाता है। एक टूल को दोनों को पकड़ने के लिए morphological विश्लेषण की आवश्यकता है।
बहुभाषी PII पहचान के बारे में प्रश्नों के लिए FAQ देखें।
पर्यटन अनुपालन जोखिम
पर्यटन HDPA मामलों में 38% का योगदान देता है। पैमाने और मौसमीपन मुख्य जोखिम पैदा करते हैं।
PMS रिटेंशन: होटल सिस्टम पासपोर्ट नंबर, जन्म तिथि और संपर्क डेटा एकत्र करते हैं। HDPA ने पाया कि कई सिस्टम इस डेटा को पांच या अधिक वर्षों तक रखते हैं। अधिकांश का कोई बताया हुआ उद्देश्य नहीं था। अधिकांश में कमजोर सुरक्षा नियंत्रण थे।
भुगतान डेटा: होटल स्थानीय और विदेशी अतिथियों के कार्ड डेटा को प्रोसेस करते हैं। Folio में आंशिक कार्ड नंबर होते हैं। बुकिंग सिस्टम में पूरे कार्ड विवरण होते हैं। PCI DSS और GDPR दोनों लागू होते हैं।
मौसमी कर्मचारी: आतिथ्य कर्मचारी अक्सर 4-6 महीने के अनुबंध पर काम करते हैं। HDPA ने कई मामले पाए जहां कर्मचारियों के जाने के बाद पहुंच नहीं हटाई गई। यह अंतर उच्च-टर्नओवर क्षेत्रों में सामान्य है।
HDPA अनुपालन के लिए तकनीकी चेकलिस्ट
ग्रीक भाषा में दस्तावेज़ों को प्रोसेस करने के लिए, इस न्यूनतम स्टैक का उपयोग करें। AFM पहचान के लिए दो-चरणीय modulo चेकसम सत्यापन की आवश्यकता है। AMKA पहचान के लिए जन्म-तिथि और लिंग-अंक पार्सिंग की आवश्यकता है। spaCy el_core_news के माध्यम से ग्रीक-लिपि NER जोड़ें। दोनों लिपियों में पासपोर्ट और राष्ट्रीय ID पहचान शामिल करें।
पर्यटन ऑपरेटरों के लिए, दो संगठनात्मक कदम भी आवश्यक हैं। पहला: PMS डेटा रिटेंशन अवधि का दस्तावेज़ीकरण करें। दूसरा: मौसमी कर्मचारियों के जाने पर सिस्टम पहुंच हटाएं। ये कदम सबसे सामान्य HDPA निष्कर्षों को संबोधित करते हैं।
दस्तावेज़-गहन आतिथ्य वर्कफ़्लो के लिए API प्लान के लिए pricing देखें।
anonym.legal पूर्ण चेकसम सत्यापन के साथ AFM और AMKA का पता लगाता है। यह spaCy el_core_news पाइपलाइन के माध्यम से ग्रीक-लिपि NER का समर्थन करता है।