Garante Italia: Conformità GDPR e PII Tecnica
Aggiornato al 2026
Il Regolatore della Privacy Più Attivo d'Italia
Il Garante per la protezione dei dati personali è l'autorità italiana per i dati ed è il regolatore AI più attivo dell'UE.
Due azioni ne definiscono l'approccio. Nel marzo 2023 il Garante ha ordinato a OpenAI di sospendere ChatGPT per gli utenti in Italia, riscontrando l'assenza di una base giuridica valida per il trattamento dei dati e di un controllo dell'età per i minori. OpenAI ha introdotto verifiche dell'età, la possibilità di opt-out dall'addestramento e un'informativa sulla privacy in italiano. Il servizio è ripreso nell'aprile 2023.
Nel dicembre 2024 l'autorità ha multato OpenAI con 15 milioni di euro. Tre le motivazioni: assenza di una base giuridica valida, mancanza di un'informativa chiara sull'uso dei dati per l'addestramento e assenza di un controllo dell'età per i minori.
Qualsiasi strumento AI che tratta dati personali di utenti in Italia deve rispettare questi stessi standard.
Cosa Ha Fallito nel Caso OpenAI
La multa da 15 milioni di euro ha evidenziato carenze specifiche, ognuna delle quali corrisponde a un controllo tecnico assente.
Base giuridica per i dati di addestramento: Il Garante ha rigettato il "legittimo interesse" come base per l'addestramento sui dati degli utenti. L'addestramento AI su dati personali richiede il consenso esplicito o una base contrattuale. Il solo richiamo al "legittimo interesse" non è sufficiente.
Trasparenza: Gli utenti non erano informati dell'utilizzo dei loro dati per l'addestramento e non disponevano di un chiaro meccanismo di opt-out.
Verifica dell'età: I minori potevano accedere a ChatGPT senza alcun controllo dell'età. Il Garante considera questo requisito vincolante per gli strumenti AI rivolti ai consumatori.
Implicazione chiave: Qualsiasi sistema AI che riceva input da utenti in Italia deve avere una base giuridica GDPR documentata. Il "legittimo interesse" comporta un rischio elevato.
Identificatori Nazionali Italiani
L'Italia ha formati di identificazione unici che gli strumenti generici spesso non riconoscono. Il tuo sistema di rilevamento deve coprire tutti e tre.
Codice Fiscale
Il codice fiscale è un identificativo nazionale a 16 caratteri che codifica suoni del cognome, suoni del nome, data di nascita, sesso e comune di nascita. L'ultimo carattere è una cifra di controllo.
L'analisi tecnica del Garante del 2024 ha rilevato che gli strumenti NLP generici rilevano il codice fiscale solo nel 67% dei casi. La causa principale: gli strumenti abbinano il pattern a 16 caratteri ma saltano la logica della cifra di controllo, producendo falsi positivi. Gli strumenti che ignorano le regole di estrazione delle lettere del nome non possono nemmeno verificare i codici già esistenti.
Un rilevamento efficace richiede tre elementi:
- Algoritmo completo del carattere di controllo
- Regole di estrazione delle lettere per cognome e nome
- Test su dati locali reali
Partita IVA
La partita IVA è il numero di identificazione fiscale aziendale italiano a 11 cifre. L'ultima cifra è una cifra di controllo. Compare su fatture, contratti e lettere commerciali. Lo strumento deve eseguire l'algoritmo della cifra di controllo, non limitarsi ad abbinare un pattern a 11 cifre.
Tessera Sanitaria
La tessera sanitaria include il codice fiscale come parte del suo codice. I dati sanitari sono di categoria speciale ai sensi dell'Articolo 9 del GDPR, il che innalza il livello di salvaguardia richiesto.
Requisiti del Garante per gli Strumenti AI
Le linee guida del Garante coprono tre aree.
Prima del trattamento AI: I dati PII devono essere individuati e rimossi prima che i dati entrino in un sistema AI. Per gli strumenti AI utilizzati in Italia — incluse estensioni browser e server MCP — ciò significa rimuovere codici fiscali, partite IVA e dati sanitari dai prompt prima dell'invio. Vedere la nostra guida alla conformità per sapere come registrare questo passaggio.
Per l'addestramento AI: È richiesta una base giuridica esplicita. Il consenso è la base preferita dal Garante per l'addestramento sui contenuti degli utenti. Il "legittimo interesse" richiede un test di bilanciamento scritto che dimostri come l'obiettivo dell'addestramento non prevalga sui diritti degli utenti sui propri dati.
Per gli output AI: I sistemi che producono contenuti su persone reali devono affrontare il rischio di affermazioni false. Il Garante ha identificato i dati personali falsificati come un rischio distinto che richiede una soluzione tecnica.
La Lacuna Aziendale del 63%
Un sondaggio del Garante del 2024 ha rilevato che il 63% delle aziende italiane non dispone di una policy AI allineata al GDPR. L'autorità ha reso questa lacuna un focus attivo degli audit.
Una policy priva di controlli tecnici è difficile da difendere. Il Garante punta le aziende che si affidano all'autodisciplina del personale nell'uso dei dati. La nostra panoramica sulla sicurezza illustra come i controlli automatizzati supportino le policy scritte.
Quattro Controlli per la Conformità al Garante
1. Filtraggio PII pre-invio
Rimuovere codice fiscale, partita IVA e dati della tessera sanitaria prima che l'input raggiunga qualsiasi modello AI. Questo è il principale intervento tecnico richiesto dalla logica del caso del Garante.
2. NER in lingua italiana
Utilizzare un modello di riconoscimento delle entità addestrato su testi in italiano — ad esempio spaCy it_core_news. I modelli generici addestrati sull'inglese non riconoscono i pattern dei nomi italiani. Vedere la nostra guida al rilevamento PII multilingue per la selezione del modello.
3. Documentazione della base giuridica
Per ogni strumento AI in uso: annotare la base giuridica. Se è previsto l'addestramento, aggiungere il test di bilanciamento. Conservare questi documenti in un luogo facilmente accessibile agli ispettori.
4. Pista di audit
Registrare che il filtraggio è avvenuto, quali tipi di entità sono stati rilevati e cosa è stato rimosso. Questo fornisce agli ispettori le prove necessarie senza richiedere una lunga revisione manuale.