Il Garante per la protezione dei dati personali (Garante) è il regolatore della privacy AI più aggressivo dell'UE. Nel marzo 2023, il Garante è diventato la prima autorità di protezione dei dati a livello globale a vietare temporaneamente ChatGPT in Italia, costringendo OpenAI a implementare misure esplicite di verifica dell'età e trasparenza prima che il servizio fosse ripristinato. A dicembre 2024, il Garante ha multato OpenAI di 15 milioni di euro per il trattamento illecito dei dati degli utenti italiani.
Per le organizzazioni che utilizzano strumenti AI in Italia — o che implementano sistemi AI che potrebbero trattare dati personali italiani — il modello di enforcement del Garante stabilisce le aspettative tecniche più esigenti nell'UE.
Il Caso OpenAI/ChatGPT: Cosa ha Scoperto il Garante
La multa di 15 milioni di euro del Garante contro OpenAI a dicembre 2024 si basava su molteplici violazioni:
Fallimento nella verifica dell'età: ChatGPT era accessibile ai minori italiani senza una verifica dell'età adeguata. Il Garante ha riscontrato che OpenAI non ha implementato misure ragionevoli per prevenire l'uso da parte di minori di 13 anni.
Trattamento illecito dei dati di addestramento: Il Garante ha riscontrato che l'uso dei dati degli utenti italiani da parte di OpenAI per addestrare ChatGPT 3.5/4 mancava di una base legale adeguata. La richiesta di "interesse legittimo" è stata respinta: il Garante ha riscontrato che l'uso di dati personali per addestrare modelli AI commerciali richiede il consenso o una base legale più chiara di quella che i fornitori di addestramento LLM invocano tipicamente.
Mancanza di trasparenza: OpenAI non ha informato adeguatamente gli utenti italiani su come i loro dati venivano utilizzati per l'addestramento, né ha fornito meccanismi di opt-out accessibili.
Implicazioni pratiche: Qualsiasi sistema AI che tratta dati personali italiani — sia che si tratti di addestramento, affinamento o inferenza su input di utenti italiani — deve avere una base legale documentata ai sensi del GDPR secondo gli standard del Garante che vada oltre le semplici affermazioni di "interesse legittimo". Il consenso o l'esecuzione di contratti specifici è tipicamente richiesto.
Identificatori Nazionali Italiani
Codice fiscale: Il codice fiscale alfanumerico di 16 caratteri dell'Italia — uno degli identificatori nazionali più ricchi di informazioni nell'UE. Struttura:
- Caratteri 1-3: Consonanti del cognome (regole di estrazione specifiche)
- Caratteri 4-6: Consonanti e vocali del nome (regole di estrazione specifiche)
- Caratteri 7-8: Ultime due cifre dell'anno di nascita
- Carattere 9: Lettera che rappresenta il mese di nascita (A=Gennaio, B=Febbraio, C=Marzo, D=Aprile, E=Maggio, H=Giugno, L=Luglio, M=Agosto, P=Settembre, R=Ottobre, S=Novembre, T=Dicembre)
- Caratteri 10-11: Giorno di nascita (maschi: numero del giorno; femmine: giorno + 40)
- Caratteri 12-15: Codice Belfiore (4 caratteri) del comune o paese di nascita
- Carattere 16: Carattere di controllo (lettera, calcolato utilizzando un algoritmo specifico)
Il codice fiscale codifica i suoni iniziali del cognome, i suoni iniziali del nome, la data di nascita, il genere (tramite la codifica del giorno di nascita) e il luogo di nascita. È indubbiamente l'identificatore nazionale più identificativo dell'UE per contenuto informativo.
Precisione di rilevamento: Gli strumenti NLP generici rilevano il codice fiscale con solo il 67% di precisione (analisi tecnica del Garante 2024). I fallimenti: gli strumenti che abbinano schemi alfanumerici di 16 caratteri senza implementare l'algoritmo del carattere di controllo non possono distinguere i codici fiscali validi dai falsi positivi; gli strumenti che non implementano le regole di estrazione del cognome/nome non possono convalidare i numeri esistenti.
Partita IVA: Il numero di partita IVA aziendale di 11 cifre dell'Italia, con una cifra di controllo calcolata utilizzando un algoritmo di somma ponderata modulo-10. L'ultima cifra è la cifra di controllo. La partita IVA appare in tutti i documenti commerciali italiani — fatture, contratti e corrispondenza commerciale.
Tessera sanitaria: La tessera sanitaria italiana — combina il codice fiscale con dati sanitari specifici aggiuntivi. Il formato include il codice fiscale come componente.
Requisiti per gli Strumenti AI del Garante
Le linee guida del Garante sui "misure tecniche e organizzative" per i sistemi AI che trattano dati personali italiani:
Prima del trattamento AI: I PII devono essere identificati e rimossi o pseudonimizzati prima dell'input nei sistemi AI. Il contesto dell'integrazione Chrome Extension/AI del Garante: qualsiasi strumento AI che riceve dati personali italiani (nomi, codici fiscali, dati sanitari) nei prompt deve avere quegli identificatori rimossi prima della trasmissione.
Per l'addestramento AI: È richiesta una base legale documentata esplicita. Il consenso è la base preferita dal Garante per l'addestramento sui contenuti generati dagli utenti italiani. "L'interesse legittimo" richiede un test di bilanciamento documentato che dimostri che lo scopo dell'addestramento non sovrasta gli interessi di protezione dei dati degli utenti italiani.
Per le uscite AI: I sistemi che generano output su individui italiani devono implementare misure di sicurezza contro l'illusione di dati personali (generare informazioni false attribuite a individui reali) — il Garante ha segnalato questo come un rischio specifico che richiede mitigazione tecnica.
Il 63% delle imprese italiane non ha politiche di governance dei dati AI conformi al GDPR (Garante 2024). Per le organizzazioni che implementano strumenti AI in Italia: il rilevamento del codice fiscale e della partita IVA con piena validazione del carattere di controllo, NER in lingua italiana (spaCy it_core_news), e una base legale documentata ai sensi del GDPR per qualsiasi addestramento AI su dati personali italiani sono i requisiti di base per la conformità al Garante.
Fonti: