Takaisin BlogiinGDPR & Vaatimustenmukaisuus

Garante Italia: DPA, joka kielsi ChatGPT:n...

Italian Garante määräsi OpenAI:lle 15 miljoonan euron sakot joulukuussa 2024 ja kielsi ChatGPT:n tilapäisesti vuonna 2023.

April 21, 20269 min lukuaika
Italy Garantecodice fiscale detectionChatGPT ban ItalyItalian data protectionAI GDPR compliance

Italian Garante per la protezione dei dati personali (Garante) on EU:n aggressiivisin tekoälyn tietosuojaelimen sääntelijä. Maaliskuussa 2023 Garantesta tuli ensimmäinen tietosuojaviranomainen maailmassa, joka kielsi ChatGPT:n tilapäisesti Italiasta — pakottaen OpenAI:n toteuttamaan selkeät ikävarmistus- ja läpinäkyvyysmenettelyt ennen palvelun palauttamista. Joulukuussa 2024 Garante määräsi OpenAI:lle 15 miljoonan euron sakot laittomasta italialaisten käyttäjätietojen käsittelystä.

Organisaatioille, jotka käyttävät tekoälytyökaluja Italiassa — tai käyttävät tekoälyjärjestelmiä, jotka saattavat käsitellä italialaisia henkilötietoja — Garante:n valvontakäytännöt asettavat tiukimmat tekniset odotukset EU:ssa.

OpenAI/ChatGPT -tapaus: Mitä Garante löysi

Garante:n 15 miljoonan euron sakko OpenAI:lle joulukuussa 2024 perustui useisiin rikkomuksiin:

Ikävarmistuksen puute: ChatGPT oli saatavilla italialaisille alaikäisille ilman riittävää ikävarmistusta. Garante totesi, että OpenAI ei toteuttanut kohtuullisia toimenpiteitä estääkseen alle 13-vuotiaiden käyttöä.

Laiton koulutusdatankäsittely: Garante totesi, että OpenAI:n käyttö italialaisten käyttäjätietojen kouluttamisessa ChatGPT 3.5/4:lle ei ollut riittävän laillista perustaa. "Legitiimi etu" -väite hylättiin — Garante totesi, että henkilötietojen käyttö kaupallisten tekoälymallien kouluttamiseen vaatii joko suostumuksen tai selvemmän laillisen perustan kuin mitä LLM-kouluttajat tyypillisesti invokeeraavat.

Läpinäkyvyyden puute: OpenAI ei riittävästi informoinut italialaisia käyttäjiä siitä, miten heidän tietojaan käytettiin koulutuksessa, tai tarjonnut helposti saatavilla olevia opt-out-mekanismeja.

Käytännön vaikutukset: Mikä tahansa tekoälyjärjestelmä, joka käsittelee italialaisia henkilötietoja — olipa kyseessä koulutus, hienosäätö tai päättely italialaisten käyttäjätietojen perusteella — on oltava dokumentoitu GDPR-laillinen perusta Garante:n standardien mukaan, joka ylittää yksinkertaiset "legitiimi etu" -väitteet. Suostumus tai erityinen sopimuksen täyttäminen on tyypillisesti vaadittu.

Italialaiset kansalliset tunnisteet

Codice fiscale: Italian 16-merkkinen alfanumeerinen verokoodi — yksi EU:n tiedollisesti rikkaimmista kansallisista tunnisteista. Rakenne:

  • Merkit 1-3: Sukunimen konsonantit (erityiset poimintasäännöt)
  • Merkit 4-6: Etunimen konsonantit ja vokaalit (erityiset poimintasäännöt)
  • Merkit 7-8: Syntymävuoden viimeiset kaksi numeroa
  • Merkki 9: Kirjain, joka edustaa syntymäkuukautta (A= tammikuu, B= helmikuu, C= maaliskuu, D= huhtikuu, E= toukokuu, H= kesäkuu, L= heinäkuu, M= elokuu, P= syyskuu, R= lokakuu, S= marraskuu, T= joulukuu)
  • Merkit 10-11: Syntymäpäivä (miehet: päivämäärän numero; naiset: päivä + 40)
  • Merkit 12-15: Belfiore-koodi (4 merkkiä) syntymäkunta tai -maa
  • Merkki 16: Tarkistusmerkki (kirjain, lasketaan erityisen algoritmin avulla)

Codice fiscale koodaa sukunimen alkuäänet, etunimen alkuäänet, syntymäpäivän, sukupuolen (syntymäpäivän koodauksen kautta) ja syntymäpaikan. Se on kiistatta EU:n henkilökohtaisesti tunnistava kansallinen tunniste tiedollisen sisällön mukaan.

Tunnistus tarkkuus: Yleisillä NLP-työkaluilla on vain 67 % tarkkuus codice fiscalen tunnistamisessa (Garante 2024 tekninen analyysi). Epäonnistumiset: työkalut, jotka vastaavat 16-merkkisiä alfanumeerisia malleja ilman tarkistusmerkkialgoritmin toteuttamista, eivät voi erottaa voimassa olevia codici fiscali -numeroita vääristä positiivisista; työkalut, jotka eivät toteuta sukunimen/nimen poimintasääntöjä, eivät voi validoida olemassa olevia numeroita.

Partita IVA: Italian 11-numeroinen liiketoiminnan ALV-numero, jonka tarkistusnumero lasketaan painotetun summan modulus-10 -algoritmilla. Viimeinen numero on tarkistusnumero. Partita IVA esiintyy kaikissa italialaisissa kaupallisissa asiakirjoissa — laskuissa, sopimuksissa ja liiketoimintakirjeenvaihdossa.

Tessera sanitaria: Italian terveydenhuoltokortti — yhdistää codice fiscalen lisätietojen kanssa terveyteen liittyvistä asioista. Muoto sisältää codice fiscalen komponenttina.

Garante:n tekoälytyökalujen vaatimukset

Garante:n ohjeet "teknisistä ja organisatorisista toimenpiteistä" tekoälyjärjestelmille, jotka käsittelevät italialaisia henkilötietoja:

Ennen tekoälyn käsittelyä: PII on tunnistettava ja joko poistettava tai pseudonymisoitava ennen syöttämistä tekoälyjärjestelmiin. Garante:n Chrome-laajennus/tekoälyintegraatiokonteksti: mikä tahansa tekoälytyökalu, joka vastaanottaa italialaisia henkilötietoja (nimiä, codice fiscali, terveystietoja) kehotteissa, on poistettava nämä tunnisteet ennen siirtoa.

Tekoälyn koulutukseen: Vaaditaan selkeästi dokumentoitu laillinen perusta. Suostumus on Garante:n suosima perusta italialaisten käyttäjien tuottaman sisällön kouluttamiseen. "Legitiimi etu" vaatii dokumentoidun tasapainotestin, joka osoittaa, että koulutustarkoitus ei ohita italialaisten käyttäjien tietosuojan etuja.

Tekoälyn tuloksille: Järjestelmien, jotka tuottavat tuloksia italialaisista yksilöistä, on toteutettava suojatoimenpiteitä henkilökohtaisten tietojen hallusinaatioita vastaan (tuottamalla väärää tietoa, joka on liitetty todellisiin yksilöihin) — Garante on merkinnyt tämän erityiseksi riskiksi, joka vaatii teknistä lieventämistä.

63 % italialaisista yrityksistä puuttuu GDPR-yhteensopivia tekoälydatagovernance-politiikkoja (Garante 2024). Organisaatioille, jotka käyttävät tekoälytyökaluja Italiassa: codice fiscale ja partita IVA -tunnistus täydellä tarkistusmerkin validoinnilla, italiankielinen NER (spaCy it_core_news) ja dokumentoitu GDPR-laillinen perusta kaikelle tekoälyn koulutukselle italialaisista henkilötiedoista ovat Garante-yhteensopivuuden perusvaatimukset.

Lähteet:

Valmiina suojaamaan tietojasi?

Aloita PII-anonymisointi yli 285 entiteettityypillä 48 kielellä.