Italian Garante per la protezione dei dati personali (Garante) on EU:n aggressiivisin tekoälyn tietosuojaelimen sääntelijä. Maaliskuussa 2023 Garantesta tuli ensimmäinen tietosuojaviranomainen maailmassa, joka kielsi ChatGPT:n tilapäisesti Italiasta — pakottaen OpenAI:n toteuttamaan selkeät ikävarmistus- ja läpinäkyvyysmenettelyt ennen palvelun palauttamista. Joulukuussa 2024 Garante määräsi OpenAI:lle 15 miljoonan euron sakot laittomasta italialaisten käyttäjätietojen käsittelystä.
Organisaatioille, jotka käyttävät tekoälytyökaluja Italiassa — tai käyttävät tekoälyjärjestelmiä, jotka saattavat käsitellä italialaisia henkilötietoja — Garante:n valvontakäytännöt asettavat tiukimmat tekniset odotukset EU:ssa.
OpenAI/ChatGPT -tapaus: Mitä Garante löysi
Garante:n 15 miljoonan euron sakko OpenAI:lle joulukuussa 2024 perustui useisiin rikkomuksiin:
Ikävarmistuksen puute: ChatGPT oli saatavilla italialaisille alaikäisille ilman riittävää ikävarmistusta. Garante totesi, että OpenAI ei toteuttanut kohtuullisia toimenpiteitä estääkseen alle 13-vuotiaiden käyttöä.
Laiton koulutusdatankäsittely: Garante totesi, että OpenAI:n käyttö italialaisten käyttäjätietojen kouluttamisessa ChatGPT 3.5/4:lle ei ollut riittävän laillista perustaa. "Legitiimi etu" -väite hylättiin — Garante totesi, että henkilötietojen käyttö kaupallisten tekoälymallien kouluttamiseen vaatii joko suostumuksen tai selvemmän laillisen perustan kuin mitä LLM-kouluttajat tyypillisesti invokeeraavat.
Läpinäkyvyyden puute: OpenAI ei riittävästi informoinut italialaisia käyttäjiä siitä, miten heidän tietojaan käytettiin koulutuksessa, tai tarjonnut helposti saatavilla olevia opt-out-mekanismeja.
Käytännön vaikutukset: Mikä tahansa tekoälyjärjestelmä, joka käsittelee italialaisia henkilötietoja — olipa kyseessä koulutus, hienosäätö tai päättely italialaisten käyttäjätietojen perusteella — on oltava dokumentoitu GDPR-laillinen perusta Garante:n standardien mukaan, joka ylittää yksinkertaiset "legitiimi etu" -väitteet. Suostumus tai erityinen sopimuksen täyttäminen on tyypillisesti vaadittu.
Italialaiset kansalliset tunnisteet
Codice fiscale: Italian 16-merkkinen alfanumeerinen verokoodi — yksi EU:n tiedollisesti rikkaimmista kansallisista tunnisteista. Rakenne:
- Merkit 1-3: Sukunimen konsonantit (erityiset poimintasäännöt)
- Merkit 4-6: Etunimen konsonantit ja vokaalit (erityiset poimintasäännöt)
- Merkit 7-8: Syntymävuoden viimeiset kaksi numeroa
- Merkki 9: Kirjain, joka edustaa syntymäkuukautta (A= tammikuu, B= helmikuu, C= maaliskuu, D= huhtikuu, E= toukokuu, H= kesäkuu, L= heinäkuu, M= elokuu, P= syyskuu, R= lokakuu, S= marraskuu, T= joulukuu)
- Merkit 10-11: Syntymäpäivä (miehet: päivämäärän numero; naiset: päivä + 40)
- Merkit 12-15: Belfiore-koodi (4 merkkiä) syntymäkunta tai -maa
- Merkki 16: Tarkistusmerkki (kirjain, lasketaan erityisen algoritmin avulla)
Codice fiscale koodaa sukunimen alkuäänet, etunimen alkuäänet, syntymäpäivän, sukupuolen (syntymäpäivän koodauksen kautta) ja syntymäpaikan. Se on kiistatta EU:n henkilökohtaisesti tunnistava kansallinen tunniste tiedollisen sisällön mukaan.
Tunnistus tarkkuus: Yleisillä NLP-työkaluilla on vain 67 % tarkkuus codice fiscalen tunnistamisessa (Garante 2024 tekninen analyysi). Epäonnistumiset: työkalut, jotka vastaavat 16-merkkisiä alfanumeerisia malleja ilman tarkistusmerkkialgoritmin toteuttamista, eivät voi erottaa voimassa olevia codici fiscali -numeroita vääristä positiivisista; työkalut, jotka eivät toteuta sukunimen/nimen poimintasääntöjä, eivät voi validoida olemassa olevia numeroita.
Partita IVA: Italian 11-numeroinen liiketoiminnan ALV-numero, jonka tarkistusnumero lasketaan painotetun summan modulus-10 -algoritmilla. Viimeinen numero on tarkistusnumero. Partita IVA esiintyy kaikissa italialaisissa kaupallisissa asiakirjoissa — laskuissa, sopimuksissa ja liiketoimintakirjeenvaihdossa.
Tessera sanitaria: Italian terveydenhuoltokortti — yhdistää codice fiscalen lisätietojen kanssa terveyteen liittyvistä asioista. Muoto sisältää codice fiscalen komponenttina.
Garante:n tekoälytyökalujen vaatimukset
Garante:n ohjeet "teknisistä ja organisatorisista toimenpiteistä" tekoälyjärjestelmille, jotka käsittelevät italialaisia henkilötietoja:
Ennen tekoälyn käsittelyä: PII on tunnistettava ja joko poistettava tai pseudonymisoitava ennen syöttämistä tekoälyjärjestelmiin. Garante:n Chrome-laajennus/tekoälyintegraatiokonteksti: mikä tahansa tekoälytyökalu, joka vastaanottaa italialaisia henkilötietoja (nimiä, codice fiscali, terveystietoja) kehotteissa, on poistettava nämä tunnisteet ennen siirtoa.
Tekoälyn koulutukseen: Vaaditaan selkeästi dokumentoitu laillinen perusta. Suostumus on Garante:n suosima perusta italialaisten käyttäjien tuottaman sisällön kouluttamiseen. "Legitiimi etu" vaatii dokumentoidun tasapainotestin, joka osoittaa, että koulutustarkoitus ei ohita italialaisten käyttäjien tietosuojan etuja.
Tekoälyn tuloksille: Järjestelmien, jotka tuottavat tuloksia italialaisista yksilöistä, on toteutettava suojatoimenpiteitä henkilökohtaisten tietojen hallusinaatioita vastaan (tuottamalla väärää tietoa, joka on liitetty todellisiin yksilöihin) — Garante on merkinnyt tämän erityiseksi riskiksi, joka vaatii teknistä lieventämistä.
63 % italialaisista yrityksistä puuttuu GDPR-yhteensopivia tekoälydatagovernance-politiikkoja (Garante 2024). Organisaatioille, jotka käyttävät tekoälytyökaluja Italiassa: codice fiscale ja partita IVA -tunnistus täydellä tarkistusmerkin validoinnilla, italiankielinen NER (spaCy it_core_news) ja dokumentoitu GDPR-laillinen perusta kaikelle tekoälyn koulutukselle italialaisista henkilötiedoista ovat Garante-yhteensopivuuden perusvaatimukset.
Lähteet: