ऑटोरिटेट पर्सूनस्गेगेवेन्स (AP) ने अगस्त 2024 में Uber पर €29 करोड़ का जुर्माना लगाया। यह जुर्माना इसलिए लगाया गया क्योंकि Uber ने बिना किसी वैध ट्रांसफर समझौते के ड्राइवर डेटा अमेरिकी सर्वर पर भेजा था। किसी भी GDPR मामले में सीमापार डेटा ट्रांसफर के लिए इतना बड़ा जुर्माना पहले कभी नहीं लगाया गया। AP ने 2023 में 21,400 से अधिक शिकायतों को भी निपटाया। इससे यह यूरोप के सबसे व्यस्त डेटा नियामकों में से एक बन गया है।
Uber मामले में AP के निष्कर्ष
Uber ने नीदरलैंड और फ्रांस के ड्राइवरों से डेटा इकट्ठा किया। इस डेटा में स्थान इतिहास, पहचान दस्तावेज, वेतन रिकॉर्ड, ड्राइविंग रिकॉर्ड और कर फाइलें शामिल थीं। यह सब अमेरिकी सर्वर पर चला गया। AP ने माना कि ट्रांसफर का तरीका वैध नहीं था।
तीन निष्कर्षों ने इस निर्णय को आधार दिया:
- कमजोर ट्रांसफर तरीका: Uber ने बाध्यकारी कॉर्पोरेट नियमों (BCRs) का उपयोग किया। AP ने पाया कि ये शामिल ड्राइवर डेटा के दायरे या संवेदनशीलता को कवर नहीं करते थे।
- कोई ट्रांसफर इम्पैक्ट असेसमेंट (TIA) नहीं: Uber यह साबित नहीं कर सका कि अमेरिकी कानून ने सहमत ट्रांसफर सुरक्षा को बरकरार रखा।
- संयोजन से संवेदनशील डेटा: स्थान डेटा, वेतन और प्रदर्शन स्कोर मिलकर प्रत्येक ड्राइवर की विस्तृत तस्वीर देते हैं। AP ने इस मिश्रण को संवेदनशील व्यक्तिगत डेटा के समकक्ष माना।
Uber मामला एक स्पष्ट नियम स्थापित करता है। अमेरिका को भेजे जाने वाले कर्मचारी और ठेकेदार डेटा को उपभोक्ता डेटा जैसी ही TIA और अतिरिक्त उपायों की आवश्यकता है।
2025 के लिए AP प्रवर्तन फोकस क्षेत्र
2026 के लिए अपडेट किया गया
AP ने तीन ऐसे क्षेत्र चिह्नित किए हैं जिन पर वह 2025 में नजर रख रहा है।
कर्मचारी निगरानी: रिमोट-वर्क ट्रैकिंग टूल प्रमुख लक्ष्य हैं। इसमें उत्पादकता लॉग, स्क्रीन कैप्चर, कीस्ट्रोक ट्रैकिंग और रिमोट लोकेशन टूल शामिल हैं। ऐसे किसी भी टूल को तैनात करने से पहले, कंपनियों को यह दर्ज करना होगा कि उन्होंने कम घुसपैठिया विकल्पों को क्यों अस्वीकार किया।
सीमापार डेटा ट्रांसफर: Uber के फैसले के बाद, AP ट्रांसफर के तरीकों की जांच कर रहा है। जो कंपनियां अमेरिकी, एशियाई या अन्य गैर-पर्याप्त-देश सेवाओं पर निर्भर हैं, वे दायरे में हैं। HR, प्रोजेक्ट कार्य या ग्राहक डेटा के लिए अमेरिकी सॉफ्टवेयर टूल का उपयोग करने वाली किसी भी कंपनी के पास एक वर्तमान TIA फाइल पर होनी चाहिए।
स्वचालित निर्णय: AI क्रेडिट स्कोरिंग, भर्ती फिल्टर और प्रदर्शन प्रणालियां Article 22 कर्तव्यों को ट्रिगर करती हैं। AP उन संगठनों को लक्षित करता है जो वास्तविक मानवीय समीक्षा चरण के बिना स्वचालित निर्णय लेते हैं। कर्मचारियों और उपभोक्ताओं दोनों को कवर करना होगा।
BSN: एक संरक्षित राष्ट्रीय पहचानकर्ता
Burgerservicenummer (BSN) नीदरलैंड में उपयोग की जाने वाली 9 अंकों की ID संख्या है। इसे Elfproef (एकादश-प्रमाण) जांच का उपयोग करके सत्यापित किया जाता है। जांच चलाने के लिए: प्रत्येक अंक को 9 से −1 तक के भार से गुणा करें, परिणामों को जोड़ें, और कुल 11 से समान रूप से विभाज्य होनी चाहिए।
BSN अधिनियम (Wet algemene bepalingen burgerservicenummer) BSN उपयोग को विशिष्ट कानूनी संदर्भों तक सीमित करता है। ये हैं: कर, स्वास्थ्य सेवा, सरकार और नियोक्ता पेरोल। इन संदर्भों के बाहर BSN का उपयोग BSN अधिनियम प्रवर्तन को ट्रिगर करता है। इसके ऊपर GDPR देनदारी भी लागू होती है।
जेनेरिक टूल BSN को क्यों चूक जाते हैं: कई NLP टूल में Elfproef जांच शामिल नहीं है। इसके बिना, किसी भी 9 अंकों की स्ट्रिंग को संभावित BSN के रूप में फ्लैग किया जाता है। इससे वित्त और प्रशासन दस्तावेजों में झूठे अलार्म बनते हैं। गलत टाइप किए गए BSN भी चूक जाते हैं। वे जांच में विफल होते हैं लेकिन फिर भी एक वैध पैटर्न जैसे दिखते हैं। यूरोपीय ID प्रारूपों में पूर्ण तुलना के लिए हमारा EU राष्ट्रीय कर ID और PII डिटेक्शन गाइड देखें।
डच टेक्स्ट के लिए NER
डच (Nederlands) में ऐसी विशेषताएं हैं जो अंग्रेजी पर प्रशिक्षित मॉडल को अटकाती हैं।
मिश्रित शब्द: डच शब्दों को जोड़ती है। Persoonsgegevens (व्यक्तिगत डेटा) और Burgerservicenummer (नागरिक ID संख्या) प्रत्येक एक शब्द है। अंग्रेजी के लिए बने मॉडल अक्सर उन्हें गलत जगह पर विभाजित कर देते हैं। इससे इकाई पहचान टूट जाती है।
नाम के अंत: पहले नामों में -je और -tje प्रत्यय दिखाई देते हैं — Annetje, Hansje। नाम मॉडल को आधार रूप और संक्षिप्त रूप दोनों को संभालना होगा।
पता प्रारूप: सड़क के प्रकारों में Straat, Laan, Weg, Plein और Gracht शामिल हैं। पोस्टल कोड चार अंकों और दो अक्षरों का उपयोग करते हैं (उदाहरण: 1234 AB)। प्रत्येक कोड एकल सड़क से मेल खाता है, इसलिए यह अधिकांश यूरोपीय पोस्टल कोड की तुलना में अधिक जानकारी उजागर करता है।
IBAN प्रारूप: डच IBAN 18 अक्षर होते हैं: NL + 2 चेक अंक + 4-अक्षर बैंक कोड + 10-अंक खाता संख्या। देश में कार्ड भुगतान का उपयोग अधिक है। इसके परिणामस्वरूप वित्तीय दस्तावेजों में कई IBAN होते हैं। ID प्रकारों में कॉन्फिडेंस-स्कोरिंग विधियों के लिए, बाइनरी PII डिटेक्शन और कॉन्फिडेंस स्कोरिंग देखें।
AP अनुपालन के लिए तकनीकी चेकलिस्ट
AP के वर्तमान मानकों को पूरा करने के लिए, डेटा सिस्टम को निम्न की आवश्यकता है:
- Elfproef के साथ BSN डिटेक्शन — केवल पैटर्न मिलान पर्याप्त नहीं है
- डच-भाषा NER — spaCy
nl_core_newsजैसा एक मॉडल मिश्रित शब्दों और संक्षिप्त-रूप नामों को संभालता है - IBAN डिटेक्शन — प्रारूप-जागरूक, जेनेरिक नहीं
- सभी सीमापार ट्रांसफर के लिए उपप्रोसेसर रिकॉर्ड
- US वेंडर के लिए TIA — Uber के फैसले के बाद एक जीवंत AP ऑडिट प्राथमिकता
Uber के बाद, US वेंडर के लिए TIA एक आधारभूत आवश्यकता है, न कि एक सर्वोत्तम अभ्यास। फैसले और इसके ट्रांसफर निहितार्थों के पूर्ण विवरण के लिए, AP Uber जुर्माना और सीमापार ट्रांसफर प्रवर्तन देखें।