गारांते इटली: GDPR और PII तकनीकी अनुपालन
2026 के लिए अपडेट
इटली का सबसे सक्रिय गोपनीयता नियामक
Garante per la protezione dei dati personali इटली का डेटा प्राधिकरण है। यह EU का सबसे सक्रिय AI नियामक है।
दो कार्रवाइयाँ इसके दृष्टिकोण को परिभाषित करती हैं। मार्च 2023 में, गारांते ने OpenAI को इटली में उपयोगकर्ताओं के लिए ChatGPT बंद करने को कहा। उसने डेटा उपयोग के लिए कोई वैध कानूनी आधार नहीं पाया। उसने नाबालिगों के लिए कोई आयु जांच भी नहीं पाई। OpenAI ने आयु नियंत्रण, एक प्रशिक्षण ऑप्ट-आउट और इतालवी में एक गोपनीयता नोटिस जोड़ा। सेवा अप्रैल 2023 में वापस आई।
दिसंबर 2024 में, प्राधिकरण ने OpenAI पर €15 मिलियन का जुर्माना लगाया। तीन चीजों ने जुर्माने का कारण बना: कोई वैध कानूनी आधार नहीं, प्रशिक्षण उपयोग के बारे में कोई स्पष्ट नोटिस नहीं और नाबालिगों के लिए कोई आयु जांच नहीं।
इटली में उपयोगकर्ताओं से व्यक्तिगत डेटा संभालने वाले किसी भी AI उपकरण को इन्हीं मानकों को पूरा करना होगा।
OpenAI मामले में क्या विफल हुआ
€15 मिलियन जुर्माने ने विशिष्ट खामियों का नाम दिया। प्रत्येक एक गायब तकनीकी नियंत्रण पर मैप होती है।
प्रशिक्षण डेटा कानूनी आधार: गारांते ने उपयोगकर्ता डेटा पर प्रशिक्षण के आधार के रूप में "वैध हित" को अस्वीकार कर दिया। व्यक्तिगत डेटा पर AI प्रशिक्षण के लिए स्पष्ट सहमति या अनुबंध आधार की जरूरत है। केवल "वैध हित" का दावा पास नहीं होता।
पारदर्शिता: उपयोगकर्ताओं को नहीं बताया गया कि प्रशिक्षण के लिए उनके डेटा का उपयोग कैसे किया गया। उनके पास कोई स्पष्ट ऑप्ट-आउट नहीं था।
आयु सत्यापन: नाबालिग बिना आयु जांच के ChatGPT तक पहुंच सकते थे। गारांते इसे उपभोक्ता AI उपकरणों के लिए एक कठोर नियम मानता है।
प्रमुख निहितार्थ: इटली में उपयोगकर्ता इनपुट लेने वाली किसी भी AI प्रणाली में एक दस्तावेज़ीकृत GDPR कानूनी आधार होना चाहिए। "वैध हित" उच्च जोखिम है।
इतालवी राष्ट्रीय पहचानकर्ता
इटली में अद्वितीय ID प्रारूप हैं। सामान्य उपकरण अक्सर उन्हें चूक जाते हैं। आपके पहचान स्टैक में तीनों को कवर करना होगा।
Codice Fiscale
Codice fiscale एक 16-वर्णिक राष्ट्रीय ID है। यह उपनाम ध्वनियों, दिए गए नाम ध्वनियों, जन्म तारीख, लिंग और जन्म शहर को एन्कोड करता है। अंतिम वर्ण एक चेक अंक है।
2024 के गारांते तकनीकी विश्लेषण ने पाया कि सामान्य NLP उपकरण codice fiscale को केवल 67% समय ही पकड़ते हैं। मुख्य विफलता: उपकरण 16-वर्णिक पैटर्न मिलाते हैं लेकिन चेक अंक तर्क छोड़ देते हैं। फिर वे गलत सकारात्मक परिणाम देते हैं। जो उपकरण नाम-एन्कोडिंग नियमों को छोड़ते हैं वे मौजूदा कोड सत्यापित भी नहीं कर सकते।
अच्छी पहचान के लिए तीन चीजें चाहिए:
- पूर्ण चेक वर्ण एल्गोरिथ्म
- उपनाम और दिए गए नाम अक्षर निष्कर्षण नियम
- वास्तविक स्थानीय डेटा के खिलाफ परीक्षण
Partita IVA
Partita IVA इटली का 11-अंकीय व्यापार VAT नंबर है। अंतिम अंक एक चेक अंक है। यह इनवॉइस, अनुबंध और व्यावसायिक पत्रों में दिखाई देता है। आपके उपकरण को चेक अंक एल्गोरिथ्म चलाना होगा, केवल 11-अंकीय पैटर्न मिलाना नहीं।
Tessera Sanitaria
स्वास्थ्य कार्ड (tessera sanitaria) अपने कोड के हिस्से के रूप में codice fiscale रखता है। स्वास्थ्य डेटा GDPR अनुच्छेद 9 के तहत विशेष-श्रेणी है। यह आवश्यक सुरक्षा स्तर को बढ़ाता है।
AI उपकरणों के लिए गारांते आवश्यकताएं
गारांते की मार्गदर्शिका तीन क्षेत्रों को कवर करती है।
AI प्रसंस्करण से पहले: डेटा AI प्रणाली में प्रवेश करने से पहले PII को खोजा और हटाया जाना चाहिए। इटली में उपयोग किए जाने वाले AI उपकरणों के लिए — ब्राउज़र एक्सटेंशन और MCP सर्वर सहित — इसका मतलब है कि प्रॉम्प्ट भेजे जाने से पहले codici fiscali, partite IVA और स्वास्थ्य डेटा को हटाना। देखें हमारी अनुपालन गाइड कि इस चरण को कैसे रिकॉर्ड करें।
AI प्रशिक्षण के लिए: स्पष्ट कानूनी आधार आवश्यक है। उपयोगकर्ता सामग्री पर प्रशिक्षण के लिए सहमति गारांते का पसंदीदा आधार है। "वैध हित" के लिए एक लिखित संतुलन परीक्षण की आवश्यकता है। उस परीक्षण को यह दिखाना होगा कि प्रशिक्षण लक्ष्य उपयोगकर्ताओं के डेटा अधिकारों को ओवरराइड नहीं करता।
AI आउटपुट के लिए: वास्तविक लोगों के बारे में सामग्री लिखने वाली प्रणालियों को गलत दावों के जोखिम को संबोधित करना होगा। गारांते ने निर्मित व्यक्तिगत डेटा को एक विशिष्ट जोखिम के रूप में नामित किया है जिसे तकनीकी समाधान की जरूरत है।
63% उद्यम अंतर
2024 के गारांते सर्वेक्षण ने पाया कि 63% इतालवी फर्मों के पास GDPR-संरेखित AI नीति नहीं है। प्राधिकरण ने इस अंतर को एक सक्रिय ऑडिट फोकस बनाया है।
tकनीकी नियंत्रणों के बिना एक नीति का बचाव करना कठिन है। गारांते उन फर्मों को लक्षित करता है जो डेटा उपयोग को स्व-पुलिस करने के लिए कर्मचारियों पर निर्भर हैं। हमारा सुरक्षा अवलोकन दिखाता है कि स्वचालित नियंत्रण कैसे लिखित नीति का समर्थन करते हैं।
गारांते अनुपालन के लिए चार नियंत्रण
1. प्री-सबमिशन PII फ़िल्टरिंग
कोड fiscale, partita IVA और tessera sanitaria डेटा को किसी भी AI मॉडल तक पहुंचने से पहले हटाएं। यह गारांते के मामले तर्क की मांग करने वाला मुख्य तकनीकी समाधान है।
2. इतालवी-भाषा NER
इतालवी टेक्स्ट पर प्रशिक्षित एक नामांकित इकाई मॉडल का उपयोग करें। उदाहरण के लिए, spaCy it_core_news। सामान्य अंग्रेजी-प्रशिक्षित मॉडल इतालवी नाम पैटर्न चूक जाते हैं। मॉडल चयन के लिए देखें हमारी बहुभाषी PII पहचान गाइड।
3. कानूनी आधार दस्तावेज़ीकरण
उपयोग में प्रत्येक AI उपकरण के लिए: कानूनी आधार लिखें। यदि प्रशिक्षण शामिल है, तो संतुलन परीक्षण जोड़ें। इन्हें वहाँ संग्रहीत करें जहाँ ऑडिटर जल्दी से पा सकें।
4. ऑडिट ट्रेल
लॉग करें कि फ़िल्टरिंग चली, कौन से इकाई प्रकार मिले और क्या हटाया गया। यह निरीक्षकों को लंबी मैन्युअल समीक्षा के बिना आवश्यक साक्ष्य देता है।