Garante Italia: Uzingatiaji wa GDPR na PII wa Kiufundi
Imesasishwa kwa 2026
Mdhibiti wa Faragha Anayefanya Kazi Zaidi wa Italia
Garante per la protezione dei dati personali ni mamlaka ya data ya Italia. Ndiyo mdhibiti wa AI anayefanya kazi zaidi katika EU.
Vitendo viwili vinaelezea mbinu yake. Mwezi Machi 2023, Garante iliambia OpenAI kusimamisha ChatGPT kwa watumiaji Italia. Iligundua hakuna msingi halali wa kisheria kwa matumizi ya data. Pia iligundua hakuna ukaguzi wa umri kwa watoto wadogo. OpenAI iliongeza udhibiti wa umri, chaguo la kutofunza, na arifa ya faragha kwa Kiitaliano. Huduma ilirudi Aprili 2023.
Mwezi Desemba 2024, mamlaka ilimuadhibu OpenAI euro milioni 15. Mambo matatu yalisababisha faini: hakuna msingi halali wa kisheria, hakuna arifa wazi kuhusu matumizi ya mafunzo, na hakuna ukaguzi wa umri kwa watoto wadogo.
Zana yoyote ya AI inayoshughulikia data ya kibinafsi kutoka kwa watumiaji Italia lazima ikidhi viwango hivyo hivyo.
Kilichoshindwa katika Kesi ya OpenAI
Faini ya euro milioni 15 iliorodhesha mapengo maalum. Kila mmoja unaorodhesha udhibiti wa kiufundi uliokosekana.
Msingi wa kisheria wa data ya mafunzo: Garante ilikataa "maslahi halali" kama msingi wa kufunza kwenye data ya mtumiaji. Mafunzo ya AI kwenye data ya kibinafsi yanahitaji idhini wazi au msingi wa mkataba. Dai la "maslahi halali" peke yake haipiti.
Uwazi: Watumiaji hawakuambiwa jinsi data yao ilitumika kwa mafunzo. Hawakuwa na chaguo wazi la kujiondoa.
Uthibitishaji wa umri: Watoto wadogo wangeweza kufikia ChatGPT bila ukaguzi wa umri. Garante inaitendea hii kama kanuni kali kwa zana za AI za watumiaji.
Athari muhimu: Mfumo wowote wa AI unaochukua uingizaji wa mtumiaji Italia lazima uwe na msingi wa kisheria wa GDPR ulioandikwa. "Maslahi halali" ni hatari kubwa.
Vitambulisho vya Taifa vya Italia
Italia ina muundo wa pekee wa vitambulisho. Zana za jumla mara nyingi zinakikosa. Mrundikano wako wa utambuzi lazima ushughulikie vyote vitatu.
Codice Fiscale
Codice fiscale ni kitambulisho cha taifa cha herufi 16. Inasimba sauti za jina la ukoo, sauti za jina la kwanza, tarehe ya kuzaliwa, jinsia, na mji wa kuzaliwa. Herufi ya mwisho ni tarakimu ya ukaguzi.
Uchambuzi wa kiufundi wa Garante wa 2024 uligundua kwamba zana za jumla za NLP zinashika codice fiscale kwa asilimia 67 tu ya wakati. Kushindwa kuu: zana zinaoanisha mifumo ya herufi 16 lakini zinaruka mantiki ya tarakimu ya ukaguzi. Kisha zinazalisha uwongo wa "chanya". Zana zinazoruka kanuni za uchimbaji wa herufi za jina pia haziwezi kuthibitisha nambari zilizopo.
Utambuzi mzuri unahitaji mambo matatu:
- Algoriti kamili ya herufi ya ukaguzi
- Kanuni za uchimbaji wa herufi za jina la ukoo na jina la kwanza
- Kupima dhidi ya data ya ndani halisi
Partita IVA
Partita IVA ni nambari ya VAT ya biashara ya Italia yenye tarakimu 11. Tarakimu ya mwisho ni tarakimu ya ukaguzi. Inaonekana katika ankara, mikataba, na barua za biashara. Zana yako lazima iendeshe algoriti ya tarakimu ya ukaguzi, si tu kuoanisha mifumo ya tarakimu 11.
Tessera Sanitaria
Kadi ya afya (tessera sanitaria) inashikilia codice fiscale kama sehemu ya nambari yake. Data ya afya ni ya kategoria maalum chini ya GDPR Kifungu cha 9. Hiyo inainua kiwango cha dhamana kinachohitajika.
Mahitaji ya Garante kwa Zana za AI
Mwongozo wa Garante unashughulikia maeneo matatu.
Kabla ya usindikaji wa AI: PII lazima ipatikane na kuondolewa kabla ya data kuingia mfumo wa AI. Kwa zana za AI zinazotumika Italia -- ikiwa ni pamoja na viendelezi vya kivinjari na seva za MCP -- hii inamaanisha kuondoa codici fiscali, partite IVA, na data ya afya kutoka kwa ombi kabla hazijatumwa. Tazama mwongozo wetu wa uzingatiaji jinsi ya kurekodia hatua hii.
Kwa mafunzo ya AI: Msingi halali wa kisheria unahitajika. Idhini ndiyo msingi unaopendelewa na Garante kwa kufunza kwenye maudhui ya mtumiaji. "Maslahi halali" yanahitaji mtihani wa uwiano ulioundwa. Mtihani huo lazima uonyeshe lengo la mafunzo halilindii haki za data za watumiaji.
Kwa matokeo ya AI: Mifumo inayoandika maudhui kuhusu watu halisi lazima ishughulikie hatari ya madai ya uwongo. Garante imeitaja data ya kibinafsi iliyobuniwa kama hatari tofauti inayohitaji kurekebika kwa kiufundi.
Pengo la Asilimia 63 la Biashara
Utafiti wa Garante wa 2024 uligundua kwamba asilimia 63 ya makampuni ya Italia hayana sera ya AI iliyooanishwa na GDPR. Mamlaka imefanya pengo hili kuwa mada inayofanya kazi ya ukaguzi.
Sera bila udhibiti wa kiufundi ni ngumu kujitetea. Garante inalenga makampuni yanayotegemea wafanyakazi kujidhibiti matumizi ya data. Muhtasari wetu wa usalama unaonyesha jinsi udhibiti wa kiotomatiki unavyounga mkono sera iliyoandikwa.
Udhibiti Manne kwa Uzingatiaji wa Garante
1. Uchujaji wa PII wa kabla ya uwasilishaji
Ondoa data ya codice fiscale, partita IVA, na tessera sanitaria kabla ya uingizaji haujafika mfano wowote wa AI. Hii ndiyo urekebishaji wa kiufundi wa msingi ambao mantiki ya kesi ya Garante inadai.
2. NER ya Kiitaliano
Tumia mfano wa maneno wa kuunda uliofunzwa kwenye maandishi ya Kiitaliano. Kwa mfano, spaCy it_core_news. Mifano ya jumla iliyofunzwa kwa Kiingereza inakosa mifumo ya majina ya Kiitaliano. Tazama mwongozo wetu wa utambuzi wa PII wa lugha nyingi kwa uchaguzi wa mfano.
3. Kumbukumbu ya msingi wa kisheria
Kwa kila zana ya AI inayotumika: andika msingi wa kisheria. Ikiwa mafunzo yanahusika, ongeza mtihani wa uwiano. Hifadhi hizi mahali ambapo wakaguzi wanaweza kuzipata haraka.
4. Mkondo wa ukaguzi
Andika kwamba uchujaji ulifanyika, aina gani za maneno zilipatikana, na kilichoondolewa. Hii inawapa wakaguzi ushahidi wanaohitaji bila mapitio marefu ya mikono.