anonym.legal
Takaisin BlogiinGDPR & Vaatimustenmukaisuus

Garante Italia: DPA, joka kielsi ChatGPT:n — Mitä italialainen tekoäly ja PII-vaatimukset edellyttävät

Italian Garante määräsi OpenAI:lle 15 miljoonan euron sakot joulukuussa 2024 ja kielsi ChatGPT:n tilapäisesti vuonna 2023. 63 % italialaisista yrityksistä ei omaa tekoälydatagovernance-politiikkoja. Codice fiscale ja partita IVA tekniset tunnistusvaatimukset.

March 7, 20269 min lukuaika
Italy Garantecodice fiscale detectionChatGPT ban ItalyItalian data protectionAI GDPR compliance

Italian Garante per la protezione dei dati personali (Garante) on EU:n aggressiivisin tekoälyn tietosuojaelimen sääntelijä. Maaliskuussa 2023 Garantesta tuli ensimmäinen tietosuojaviranomainen maailmassa, joka kielsi ChatGPT:n tilapäisesti Italiasta — pakottaen OpenAI:n toteuttamaan selkeät ikävarmistus- ja läpinäkyvyysmenettelyt ennen palvelun palauttamista. Joulukuussa 2024 Garante määräsi OpenAI:lle 15 miljoonan euron sakot laittomasta italialaisten käyttäjätietojen käsittelystä.

Organisaatioille, jotka käyttävät tekoälytyökaluja Italiassa — tai käyttävät tekoälyjärjestelmiä, jotka saattavat käsitellä italialaisia henkilötietoja — Garante:n valvontakäytännöt asettavat tiukimmat tekniset odotukset EU:ssa.

OpenAI/ChatGPT -tapaus: Mitä Garante löysi

Garante:n 15 miljoonan euron sakko OpenAI:lle joulukuussa 2024 perustui useisiin rikkomuksiin:

Ikävarmistuksen puute: ChatGPT oli saatavilla italialaisille alaikäisille ilman riittävää ikävarmistusta. Garante totesi, että OpenAI ei toteuttanut kohtuullisia toimenpiteitä estääkseen alle 13-vuotiaiden käyttöä.

Laiton koulutusdatankäsittely: Garante totesi, että OpenAI:n käyttö italialaisten käyttäjätietojen kouluttamisessa ChatGPT 3.5/4:lle ei ollut riittävän laillista perustaa. "Legitiimi etu" -väite hylättiin — Garante totesi, että henkilötietojen käyttö kaupallisten tekoälymallien kouluttamiseen vaatii joko suostumuksen tai selvemmän laillisen perustan kuin mitä LLM-kouluttajat tyypillisesti invokeeraavat.

Läpinäkyvyyden puute: OpenAI ei riittävästi informoinut italialaisia käyttäjiä siitä, miten heidän tietojaan käytettiin koulutuksessa, tai tarjonnut helposti saatavilla olevia opt-out-mekanismeja.

Käytännön vaikutukset: Mikä tahansa tekoälyjärjestelmä, joka käsittelee italialaisia henkilötietoja — olipa kyseessä koulutus, hienosäätö tai päättely italialaisten käyttäjätietojen perusteella — on oltava dokumentoitu GDPR-laillinen perusta Garante:n standardien mukaan, joka ylittää yksinkertaiset "legitiimi etu" -väitteet. Suostumus tai erityinen sopimuksen täyttäminen on tyypillisesti vaadittu.

Italialaiset kansalliset tunnisteet

Codice fiscale: Italian 16-merkkinen alfanumeerinen verokoodi — yksi EU:n tiedollisesti rikkaimmista kansallisista tunnisteista. Rakenne:

  • Merkit 1-3: Sukunimen konsonantit (erityiset poimintasäännöt)
  • Merkit 4-6: Etunimen konsonantit ja vokaalit (erityiset poimintasäännöt)
  • Merkit 7-8: Syntymävuoden viimeiset kaksi numeroa
  • Merkki 9: Kirjain, joka edustaa syntymäkuukautta (A= tammikuu, B= helmikuu, C= maaliskuu, D= huhtikuu, E= toukokuu, H= kesäkuu, L= heinäkuu, M= elokuu, P= syyskuu, R= lokakuu, S= marraskuu, T= joulukuu)
  • Merkit 10-11: Syntymäpäivä (miehet: päivämäärän numero; naiset: päivä + 40)
  • Merkit 12-15: Belfiore-koodi (4 merkkiä) syntymäkunta tai -maa
  • Merkki 16: Tarkistusmerkki (kirjain, lasketaan erityisen algoritmin avulla)

Codice fiscale koodaa sukunimen alkuäänet, etunimen alkuäänet, syntymäpäivän, sukupuolen (syntymäpäivän koodauksen kautta) ja syntymäpaikan. Se on kiistatta EU:n henkilökohtaisesti tunnistava kansallinen tunniste tiedollisen sisällön mukaan.

Tunnistus tarkkuus: Yleisillä NLP-työkaluilla on vain 67 % tarkkuus codice fiscalen tunnistamisessa (Garante 2024 tekninen analyysi). Epäonnistumiset: työkalut, jotka vastaavat 16-merkkisiä alfanumeerisia malleja ilman tarkistusmerkkialgoritmin toteuttamista, eivät voi erottaa voimassa olevia codici fiscali -numeroita vääristä positiivisista; työkalut, jotka eivät toteuta sukunimen/nimen poimintasääntöjä, eivät voi validoida olemassa olevia numeroita.

Partita IVA: Italian 11-numeroinen liiketoiminnan ALV-numero, jonka tarkistusnumero lasketaan painotetun summan modulus-10 -algoritmilla. Viimeinen numero on tarkistusnumero. Partita IVA esiintyy kaikissa italialaisissa kaupallisissa asiakirjoissa — laskuissa, sopimuksissa ja liiketoimintakirjeenvaihdossa.

Tessera sanitaria: Italian terveydenhuoltokortti — yhdistää codice fiscalen lisätietojen kanssa terveyteen liittyvistä asioista. Muoto sisältää codice fiscalen komponenttina.

Garante:n tekoälytyökalujen vaatimukset

Garante:n ohjeet "teknisistä ja organisatorisista toimenpiteistä" tekoälyjärjestelmille, jotka käsittelevät italialaisia henkilötietoja:

Ennen tekoälyn käsittelyä: PII on tunnistettava ja joko poistettava tai pseudonymisoitava ennen syöttämistä tekoälyjärjestelmiin. Garante:n Chrome-laajennus/tekoälyintegraatiokonteksti: mikä tahansa tekoälytyökalu, joka vastaanottaa italialaisia henkilötietoja (nimiä, codice fiscali, terveystietoja) kehotteissa, on poistettava nämä tunnisteet ennen siirtoa.

Tekoälyn koulutukseen: Vaaditaan selkeästi dokumentoitu laillinen perusta. Suostumus on Garante:n suosima perusta italialaisten käyttäjien tuottaman sisällön kouluttamiseen. "Legitiimi etu" vaatii dokumentoidun tasapainotestin, joka osoittaa, että koulutustarkoitus ei ohita italialaisten käyttäjien tietosuojan etuja.

Tekoälyn tuloksille: Järjestelmien, jotka tuottavat tuloksia italialaisista yksilöistä, on toteutettava suojatoimenpiteitä henkilökohtaisten tietojen hallusinaatioita vastaan (tuottamalla väärää tietoa, joka on liitetty todellisiin yksilöihin) — Garante on merkinnyt tämän erityiseksi riskiksi, joka vaatii teknistä lieventämistä.

63 % italialaisista yrityksistä puuttuu GDPR-yhteensopivia tekoälydatagovernance-politiikkoja (Garante 2024). Organisaatioille, jotka käyttävät tekoälytyökaluja Italiassa: codice fiscale ja partita IVA -tunnistus täydellä tarkistusmerkin validoinnilla, italiankielinen NER (spaCy it_core_news) ja dokumentoitu GDPR-laillinen perusta kaikelle tekoälyn koulutukselle italialaisista henkilötiedoista ovat Garante-yhteensopivuuden perusvaatimukset.

Lähteet:

Valmiina suojaamaan tietojasi?

Aloita PII-anonymisointi yli 285 entiteettityypillä 48 kielellä.